私募巨头幻方量化又有新动作,第一代大模型DeepSeek Coder已经开源

xiangqiankan

  11月2日晚间,知名私募巨头幻方量化宣布,公司旗下的DeepSeek已经发布第一代大模型DeepSeed Coder,免费商用,完全开源。

  据介绍,DeepSeek Coder已开源1B,7B,33B 全系列模型,包含Base模型和指令调优模型。在国际权威数据集HumanEval编程多语言测试上,DeepSeek Coder在各个语言上的表现都领先已有的开源模型。

  与之前最好的开源大模型CodeLlama相比,DeepSeek Coder在代码生成任务上(使用标准数据集HumanEval、MBPP和DS-1000进行评测)分别领先 9.3%、10.8% 和 5.9%。其中DeepSeek Coder的70亿参数版本在代码能力上达到了CodeLlama的340亿参数水平。经过指令调优后的DeepSeek Coder模型更是全面超越了GPT3.5-Turbo。

  除了代码能力以外,DeepSeek Coder也展现了极强的数学和推理能力,不通过任何指令微调,在数学推理评测上展现了极佳的性能。

  此前,幻方量化曾在4月中旬宣布将集中资源和力量,全力投身到服务于全人类共同利益的人工智能技术之中,成立新的独立的研究组织探索AGI的本质。

私募巨头幻方量化又有新动作,第一代大模型DeepSeek Coder已经开源 第1张

  随后,北京深度求索人工智能基础技术研究有限公司(以下简称“北京深度求索”)和杭州深度求索人工智能基础技术研究有限公司(以下简称“杭州深度求索”)分别于5月中旬和7月中旬成立。

  天眼查APP数据显示,截至目前,北京深度求索由杭州深度求索100%控股,而幻方量化的实际控制人梁文锋在杭州深度求索最终受益的股份比例达84.29%。

  幻方量化是国内最为知名的量化私募巨头之一,旗下拥有浙江九章资产和宁波幻方量化两大百亿私募平台,目前总管理规模超过400亿元。

  事实上,幻方量化在AI领域布局已久。公开资料显示,早在2016年10月公司第一个由深度学习算法模型生成的股票仓位便已上线实盘交易,至2017年底公司几乎所有的量化策略都已经采用AI模型计算。2019年12月,幻方AI即杭州幻方人工智能基础研究有限公司正式成立,致力于AI的算法与基础应用研究,随后公司斥巨资打造的‘萤火一号’和‘萤火二号’陆续交付。

  今年4月幻方量化宣布成立新的独立的研究组织探索AGI的本质时,一度被外界解读为要用AI来炒股,不过相关猜想随后被幻方量化CEO陆政哲否认。陆政哲回应称,“我们探索AGI不是用来炒股的,是做GTP相关的大模型,与金融无关。我们独立于投资新成立了一个团队,相当于二次创业,从事的是科技方向,只是大家习惯把我们局限在投资领域。”

  如今,DeepSeek Coder大模型的发布,意味着幻方量化探索AGI本质的计划在官宣半年之后已经取得了阶段性的成果。不过,幻方量化在这条路上最终究竟能够走到哪里,目前尚未可知。

  值得一提的是,除了在大模型领域的进展以外,近期幻方量化还有其他两件事引起了市场的关注。

  其一是作为公司股东之一的徐进被爆出“婚外情”风波,对此幻方量化发布情况说明称,公司团队成员徐进对于个人家庭事务处理不当,引发负面舆论,对公司声誉造成不良影响。经团队讨论,决定对徐进作出停职处理。以上处理决定不影响公司基金正常运作。

  其二是有消息称“当前幻方量化已经暂停渠道募资”。对此,幻方量化市场人士曾回应称,幻方量化当前的基金管理规模是400多亿元,这个规模目前来看是策略比较合适的规模。