DeepSeek除夕炸场!开源多模态模型发布,仅128颗A100训练,英伟达市值减4.3万亿|钛媒体AGI

(图片来源:theVerge)DeepSeek除夕放大招,这绝对是AI行业最难眠的一夜了。1月28日凌晨,人工智能社区HuggingFace显示,DeepSeek刚刚发布了开源模型Janus-Pro,拥有10亿和70亿参数规模,仅使用128颗A100进行训练1周。其中,Janus-Pro-7B在GenEval和DPG-Bench基准测试中击败

字节跳动将斥资511亿元、采购NvidiaBlackwellGPU:部署在境外

2024年12月31日,TheInformation报道,字节跳动计划2025年斥资70亿美元(511亿元人民币)购买芯片,正与数据中心运营商洽谈使用Blackwell芯片的事宜。据一位参与该计划的人士透露,字节跳动告诉供应商,计划在2025年斥资70亿美元在中国境外使用Nvidia芯片。张一鸣告诉一些供应