阿里巴巴发布最新AI推理模型
中国科技巨头阿里巴巴于周四发布了其最新的人工智能推理模型QwQ-32B,并宣称其性能超越了OpenAI和初创公司DeepSeek的同类产品。这一消息促使阿里巴巴在香港上市的股票收盘上涨8%,并推动恒生中国企业指数走高。
QwQ-32B的性能优势
阿里巴巴在一份在线声明中称,QwQ-32B模型在性能上表现出色,几乎完全超越了OpenAI的o1-mini模型,并与最强的开源推理模型DeepSeek-R1相媲美。OpenAI-o1-mini是该公司去年发布的成本效益较高的推理模型。阿里巴巴还表示,QwQ-32B在数学、编码和通用能力方面实现了质的飞跃,整体性能与DeepSeek R1相当。
模型参数对比
阿里巴巴声称,QwQ-32B模型拥有320亿个参数,而DeepSeek的R1模型则有6710亿个参数。更少的参数意味着模型更小、训练更高效。
DeepSeek的崛起
DeepSeek在今年1月以其高性能的推理模型R1震惊了世界,该公司表示,其训练成本远低于西方竞争对手。DeepSeek的成功在全球投资者中增强了中国公司创新能力信心,尤其是在中美科技竞争加剧的背景下。自1月以来,恒生中国企业指数已上涨超过30%。
阿里巴巴的AI布局
阿里巴巴是中国电子商务平台淘宝和天猫的母公司,在OpenAI推出其行业定义的AI推理模型后,于2023年首次推出了其ChatGPT等效服务“通义千问”。今年1月,阿里巴巴发布了另一个模型Qwen 2.5 Max,称其性能超越了DeepSeek广受好评的V3模型。
巨额投资计划
上周,阿里巴巴承诺在未来三年内至少投资3800亿元人民币(约合524亿美元)用于其AI和云计算基础设施。该公司表示,这一金额超过了其过去十年在这些领域的投资总额。
中国政府的支持
周三,中国领导人承诺支持“新兴产业和未来产业”,包括增加对人工智能、人形机器人和量子技术的资金投入。