2023-11-26
最近," 百模对决 "愈演愈烈。在模型热潮中," 人才 "成为科技公司、企业家和研究机构激烈竞争的焦点。但是,目前 AIGC 该领域的尖端人才仍存在一定的空缺。
什么样的人才有利于模型研发?
大模型人才在哪里征集?
如何培养大型研发人才?
量子位智库特别邀请量子位智库来回应这些问题 AI 大模型领域的从业者和行业专家教授与企业团队和候选人分享大模型人才机遇挑战及其未来发展前景。
本文是量子位智库 " 大模型人才 " 请关注即将到来的《2023》系列深度访谈栏目。 AIGC 大型人才发展全景报告
采访人物介绍△昆仑万维董事长兼 CEO 方汉
2008 每年加入昆仑万维,依次领导研制《三国风云》 RPG 类页游《武侠风云》,并多次获奖。
精彩见解
1-2 年内,算法人才短缺将大大减少。
精彩见解
1-2 年内,算法人才短缺将大大减少。
我所理解的人才创新精神是指如何从技术和工程的角度创新地处理和改进问题。
" 挑选 " 比 " 塑造 " 更重要的是,主动学习比师傅带徒更重要。
在模型的新领域,刚毕业的博士生也可以通过半年的塑造成为权威人物。
从供给的角度来看,目前大型人才还不够,3-5 年后情况会大大减轻。
从宏观角度来看,与传统产业相比,大模型人才培养的难点在于高校目前的计算能力不足。根据 AI 以及大型模型,在应用中制作新商业模式的公司将获得最大的利润。
访谈实录如何定义大模型人才?
量子位智库:昆仑万维是如何区分大型人才的?方汉:我认为模型训练应该分为两部分,练习推论与
应用开发。根据模型培训的步骤,我们将人才分为算法侧人才、架构侧人才及其应用开发侧人才,核心算法人才分为预训练、数据处理、调整推论提升等。
量子位智库:算法人才、架构人才、应用开发人才,你认为什么样的人才更稀有?而且未来很长一段时间可能很少见。
方汉:目前看,核心算法人才必须是最稀缺的,但供需将很快得到缓解。因为这里有一个非常有趣的现象,目前各大学的计算率都很稀缺,大型模型的相关方向也是当前的热点。有很多人才可以转向这个研究领域,比如 NLP,全部做 NLP 所有的人才都在转变为大模型。
所以,我个人的看法
是 1-2 年内,算法人才短缺将大大减少,由于高薪算法人才众多,我认为中国在人才配制方面仍然非常市场化。大模型人才应具备的能力因素
量子位智库:在招聘人才时,非常重视人才本身的素质?方汉:在你所讲的学术成就、社会经验、学术背景和创新精神在这些方面,我们优先考虑
社会经验和创新精神:首先,大模型训练本质上是一个工程问题,那么社会经验当然是非常重要的。其次,大型模型是一个创新项目,因为所有的大型企业都在并驾齐驱地竞争。如果没有创新精神,就很难领先于他人,因为这是一个新的项目方向。
量子位智库:您如何看待这种创新精神?
方汉:我所理解的创新与公众定义的突破不同,过去更多的是算法创新。我所说的创新首先是遵循大模型的前沿进展。世界上有很多人在研究大模型培训。这个方向进展迅速。每天都有数百篇新论文出去,在各个方向和行业都有所改进。二是从实际需要出发,用新的方法解决工程中遇到的困难,这里的突破更注重如何从技术和工程的角度创新地处理问题,提高指标。
量子位智库:你认为大型人才的创新精神可以通过学术成果和专利成果来区分吗?
方汉:我觉得根据专利的有效性来判断人才的创新精神是不合理的。OpenAI 人才在专利申请中的表现并没有那么受重视。最好的创新实际上取决于内部经验的积累,仅从专利的角度来判断是不合理的。
但是,学术成就是判断的重要依据。例如,第一个作出 Vicuna 模型,首先制作 ControlNet 都是博士生,从这个角度来看,学术成果可以作为一定的参考。
但在实际操作过程中,
除了文化大学的创新,项目上还有无数的小创新。因此,创新精神应根据人才解决问题的速度和交付能力来确定。大型人才培养方法

量子位智库:天工大模型 1.0 升级成 3.5 在不同阶段,我们将重视人才在哪些领域的配置?方汉:在初始阶段每个人确实更应该对大模型底层架构,对 CNN、对 Transformer 更加熟悉算法人才,自然还包括数据清理、数据处理等方面的数据科学人才;直到大模型逐渐成熟,必须转化为多模态,这个时候需要一批做
机器视觉人才;要想向外界发布大模型,就需要安全审核的人才。
量子位智库:昆仑万维如何培养现有大型人才?量子位智库:昆仑万维如何培养现有大型人才?
方汉
:昆仑万维从 2020 年开始做大模型培训,当时市场上做大模型人才很少,走路 BERT 路过的人多了,走吧 GPT 路过的人很少,所以我们找到自己塑造大模型人才。
培养方法是让有算法环境的人才学习模型训练方向,在招聘时,我们应该注意选择了解机器学习和深度学习的人才。同时,我们也有自我驱动力强、学习速度快、算法环境好的人才。我们有一些人才研究 CNN 如今,技术方向将更多地转变为 GPT 练习方位。量子位智库:你觉得怎么样 " 大牛带小牛 " 这样的培养体系?
方汉
:事实上,每个技术驱动的公司都选择 " 大牛带小牛 " 但是选拔人才比培养人才更重要,主动学习比师傅带徒弟更重要,因此,人们在招聘时也非常重视人才的自学能力。
对于传统的技术方向,如 Java,要成长为权威人物,必须依靠丰富的经验,应届毕业生必须有较长的培养周期。然而,大型培训是一个新兴领域,工业积累并不比学术积累太多,我们比学术界更多的是算率,事实上,在算法方面,我们并不比大学领先太多。
量子位智库:如果应届毕业生成长为大模型专家需要多长时间?方汉
:有很多博士生可以发表非常前沿的大模型论文,也可以看到很多大模型创新论文都是博二、博三学生发表的。每个人都可以在校园里找到可以上手的人才,花几个月就可以成长为权威人物。我们的想法是,从应届毕业的博士生中选择学校表现出来创新能力
和技术视野的我们可以在短时间内培养人才 " 小牛 ",就能成为你所说的 " 大牛 "。量子位智库:这类应届博士生可以在几个月到一年内成为行业 " 大牛 ",我理解你所说的 " 大牛 " 它们具有关键研发水平。
方汉
:是的,我们给年轻人很多机会。其实 OpenAI 做 GPT 锻炼的人可能只有几十个,其中大量是刚毕业几年的人才。我认为中国的大模型团队基本上是这样的。这是一个全新的行业,新人有很大的机会。刚毕业的博士生做了半年左右,成为行业技术专家没问题,但一定缺乏管理水平。这个行业很新,大家都在同一条起跑线上向前跑,应届毕业生不一定有缺点。量子位智库:你说的应届毕业生大多是自然语言理解方向吗?实际细分到哪些领域?
方汉:也不完全是理解自然语言
,在我看来,除了数据处理需要依靠工程积累之外,在大模型的全生命环节中,预训练、RLHF、SFT、算法提升
在学术上有相应的研究内容,所以我认为他们有 70-80% 大型研发锻炼水平。很容易将机器学习、加强学习、深度学习的人才转化为大模型。而且因为现在大部分开源模型,学术界也有很多人根据开源模型做论文研究,所以我不认为高校人才在分工上有一定的差异
。中国大型人才市场的发展状况量子位智库:您认为目前大型人才市场的整体发展如何?
方汉:我认为大型人才整体处于高度稀缺状态,
所以会有更多的人做股票。可是随着大模型从业者越来越多,分工也会越来越详细,这是一个非常自然的分裂过程。任何新技术的发展过程都是这样的,从早期的全栈工程师逐渐形成组长级、主管级 leader,然后团队成员的技术方向分裂会更加明显。量子位智库:昆仑万维招聘的人才大多来自大学,还是来自这个行业?
方汉:我们目前需要它实践积淀
来自人才的选择会更多产业他们有丰富的工程经验。但也会招应届毕业生做储备,所以校招比较多,校招和社招比例差不多 1:5 的关系。
量子位智库:你认为这个大模型的人才培养处于什么阶段?
方汉
:从人才整体学术成果数量来看,全球 AI 论文数量排名第一,指中国,排名第二,指美国,论文数量超过中国。在我看来,在人才水平因素层面,不同经验的人才都是大模型所需要的,应该有刚毕业的应届储备人才、权威人物和领导者。但从提供的角度来看,目前还处于不够的环节,大概是 3-5 年后提供的情况会大大降低,
因为从设定学科到学生毕业也需要 5 年时间。培养大模型人才的难点
量子位智库:你认为人才培养可以从哪些方面进行改进?方汉
:我先从两个角度来分享,从公司的宏观角度来看。从公司视角来说,参与建设项目的人才发展更快
,这是一种非常明显和具体的形式。对人才更有耐心的大企业,人才会更有效率,但小公司大模型团队的人才成长更全面,应该有大模型全堆栈的能力因素。从宏观角度
来说,与其他传统产业相比,大模型人才培养的难点在于目前高校计算能力不足,由于高校难以培养架构人才,这些人才只能到公司进行培训。这是世界上所有大学都面临的困境。国家计算率与大学分享后,我们坚信这种情况会得到缓解。
量子位智库:即大量依靠生产、学习、研究、政策联动来培养大型人才。
方汉
:我认为我们应该尽量在校园里提供与公司相同的硬件条件,否则我们在校园里学到的东西必须相对有限。大模型人才和 AI 公司行业发展趋势
量子位智库:从你的角度来看,未来大模型行业会有什么样的发展趋势?
方汉:我觉得不应该叫大模型领域,应该是全部 AI 领域,AI 与互联网和移动互联网相比,该领域遇到的机会应该不亚于互联网。我对 AI 行业的发展趋势非常乐观,我认为 AI 它将深刻地改变整个互联网及其整个人类生活。我认为整个市场的方向会发生变化。量子位智库:基于这一趋势,您认为什么样的大型人才会更受企业青睐?
方汉
:首先,自己经过" 百模对决 "每个人都在做大的现象模型基座,未来大型模型基座将收缩到几家大型制造商提供,更多的企业应该使用大型模型,然后我认为越来越多的人根据大型应用程序进行开发。
做大型模型底层实践、优化算法和架构的人才将聚集在大型工厂或大型模型团队中,但我们认为最大的老板不一定是大型模型企业本身,而是这些基于大型模型的公司。这些公司一旦长大,就会形成自己的大模型。我们认为" 运用为王 ",是指在应用程序上的依据 AI 以及大型模型,新商业模式的公司将获得最大的利润。那么我们认为未来十年一定会有像字节、美团、滴滴这样的新形式的巨头公司,而且一定是以字节、美团、滴滴为基础的 0 到 100 今年或明年成立的企业应该有这种可能性和机会。