社会热点

DeepSeek再发新模型

字号+ 作者:品味大师 来源: 2025-01-29

齐齐哈尔新闻网1月28日电(中新财经记者 吴家驹) 1月28日凌晨,人工智能社区Hugging Face显示,DeepSeek发布了开源多模态AI模型Janus-Pro。据介绍,Janus-Pro是Janus的高级版本,其拥有优化的训练策略,扩展的训练数据以及更大的模型规模,这些改进使得Janus-

  齐齐哈尔新闻网1月28日电(中新财经记者 吴家驹) 1月28日凌晨,人工智能社区Hugging Face显示,DeepSeek发布了开源多模态AI模型Janus-Pro。据介绍,Janus-Pro是Janus的高级版本,其拥有优化的训练策略,扩展的训练数据以及更大的模型规模,这些改进使得Janus-Pro在多模态理解和文本到图像的指令跟踪能力方面都取得了重大进步,同时还增强了文本到图像生成的稳定性。Janus-Pro系列包括了参数量分别为7B和1.5B的两个型号。报告公开的测试结果显示,Janus-Pro-7B在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion。

【编辑:张子怡】


1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 加拿大多家主流媒体联合起诉OpenAI侵犯版权

    加拿大多家主流媒体联合起诉OpenAI侵犯版权

  • 港科大研发四大AI医学大模型 可为约30种癌症及疾病提供诊断

    港科大研发四大AI医学大模型 可为约30种癌症及疾病提供诊断

  • 2024人工智能十大前沿技术趋势在北京发布

    2024人工智能十大前沿技术趋势在北京发布

  • 都可赋予大模型慢思考能力 360首创CoE架构媲美OpenAI o1思维链模式

    都可赋予大模型慢思考能力 360首创CoE架构媲美OpenAI o1思维链模式