首页 / 分享百科

ChatGPT核心研发团队曝光(ChatGPT团队仅87人,3人毕业清华!AIGC点燃技术革命烽火,哪些公司有10倍潜力?)

发布时间:2023-06-12 17:00:42

ChatGPT这团火,正越烧越旺。

有机构研究了ChatGPT的团队背景,发现团队成员仅87人,且大多是拥有顶尖名校背景的“90后”。与此同时,国内已有公司开出10万月薪的天价抢人。

人才争夺战的背后,是AIGC广阔的“钱”景,也是当下行业激烈竞争的真实写照。

什么公司在蹭热点?什么公司有望长期持续成长,成为AIGC时代的核心资产?

ChatGPT团队曝光,

有公司10万月薪抢人

近日,ChatGPT团队的87个成员背景被曝光。

在ChatGPT团队中,成员的平均年龄为32岁,其中30岁以下达28人。

学历方面,有25人拥有硕士研究生学历,博士研究生则有28人。绝大多数团队成员毕业于美国名校,其中斯坦福校友最多,共14人。加州大学伯克利分校和麻省理工分列二三位,分别有10人和7人。

从工作经历看,ChatGPT团队成员大部分来自外部公司,其中有10人来自谷歌。1/4的团队成员曾参与过同样基于GPT-3的CodeX项目的研发。

值得一提的是,ChatGPT团队中也有很多中国元素。在87人的团队中,共有9位华人,其中5人本科就读于中国内地高校(清华3人、华中科技大学1人,北大/港大1人)。此外,还有一名成员曾在百度(美国研究院)任职。

上述的ChatGPT团队背景分析表明,年轻的、有顶尖名校背景的、拥有深厚技术积累的尖端人才已成为引领未来前沿科技的中坚力量。一场争夺未来的人才大战不可避免。

国内各科技大厂也纷纷行动起来。ChatGPT团队背景中的中国元素已经表明,中国并不缺乏相关人才。为了抢占人才高地,有资本大佬甚至亲自下场招兵买马。比如前美团联合创始人王慧文在朋友圈宣布将出资5000万美元投身人工智能领域,寻找“业界顶级”、“狂热爱好AI”的技术人才。

此外,不仅仅是“大厂”,一些中小型初创企业也加入到抢人大战中。最新招聘网站显示,有企业已经开出了10万的月薪。

AIGC大战已经开始,

哪些投资方向确定性高?

10万月薪抢人背后,是AIGC大战已经开始。包括百度、腾讯、阿里、字节等在内,已有10余家互联网企业宣布已有类ChatGPT技术储备、准备发布和已经发布类ChatGPT产品。

然而,风口之下,鱼龙混杂,蹭热点的公司不在少数。比如已被列为被执行人的二手奢侈品交易平台寺库,一度凭借蹭上ChatGPT股价暴涨124%。然而仅仅半个月的时间,寺库股价较高点已近乎腰斩。

那么,到底什么样的公司才有可能在AIGC的浪潮中拥有真正持久的生命力,成为真正的核心资产?要回答这个问题,首先需要搞清楚ChatGPT真正的核心技术是什么。

ChatGPT的完美运行需要三个条件:训练数据 模型算法 算力。

首先是训练数据。ChatGPT的训练数据主要来源于网络上的文本数据、社交媒体数据、问答网站数据、新闻站数据、文学作品数据等。

在ChatGPT的发展过程中,OpenAI公司曾使用了800万篇Reddit论坛的帖子进行训练,数据总量高达40GB。OpenAI还曾将此前12年从6000万个域名中收集的新闻报道、帖子、书籍全文以及各种网页等数千亿个单词的英文资料输入模型进行训练,消耗了数千万美元的计算资源。

然后是模型算法。ChatGPT是基于GPT模型开发的一款聊天机器人程序。模型的参数越多,模型就越复杂,人工智能就越具备理解上下文、连贯性等人类语言的特征。

2018年的GPT-1模型仅有1.17亿个参数;发展到GPT-2模型,参数增加至15亿;到了GPT-3阶段,模型参数达到了划时代的1750亿。未来的GPT-4模型参数规模更是可能高达一百万亿。

最后是算力。所谓算力,就相当于人类的脑容量。ChatGPT在训练模型时使用的微软AZURE云计算平台,需要近一万个英伟达A100型号的GPU芯片提供算力。

假设未来的GPT-4模型真的达到了一百万亿的参数,其要求的算力需要多达六万台A100芯片来提供,成本将非常昂贵。

中信建投分析师武超则表示:

底层的算力支撑是确定性最高的投资方向;

第二层是包括百度等类似于Open AI做大模型的公司,由于对算力、数据研发的要求极高,这类公司数量不会太多;

第三层是拥有数据和场景的做小模型、或者说中间层的公司,此类公司更多会在一些垂直行业上有更多的积累;

第四层是应用公司,按照云计算行业发展的经验或互联网规律,应用端往往是百花齐放的环节,因而不确定性也会更高。

拒绝下跌!

哪些公司有十倍成长空间潜力?

那么,哪些公司有十倍成长空间潜力?

OpenAI:ChatGPT的开发者OpenAI无疑是最被看好的公司。目前,OpenAI估值已经达到300亿美元,对标谷歌12000亿美元的市值,有10~40倍成长空间。

百度:国内的互联网巨头百度也有很大的潜力。由于中国目前不能使用ChatGPT,百度能否重复当年替代谷歌在中国大陆市场的故事,值得期待。

A股方面,细心的投资者可能已经发现,ChatGPT概念股近期出现了分化。云从科技、海天瑞声、汉王科技等前期暴涨的股票已高位回落。价值线此前文章中重点提到的三六零、科大讯飞、浪潮信息三只股票的股价却异常坚挺。

结合上文我们可以发现,这三家公司恰好对应了中信建投分析师武超则提出的前三个层次,并最有希望成为这三个层次的领军企业。

浪潮信息:

武超则认为,底层算力是确定性最高的投资方向。然而,算力中最核心的GPU却被英伟达垄断,国内企业在GPU方面的技术离英伟达仍有非常大的差距,短期内很难赶超。因此,在国内,整合GPU的AI服务器领域最有可能诞生深度受益AIGC发展的“卖铲人”。

浪潮信息是目前国内唯一一家使用英伟达GPU来做AI服务器的厂商。其AI服务器在中国市场的市占率高达52.4%,高居第一。尤其是在互联网大厂,如BAT、字节跳动等公司,浪潮信息均为第一大服务器供应商,份额均超过50%。

除了算力,浪潮信息在算法模型方面也有布局。早在2021年,浪潮信息就发布了“源1.0”人工智能巨量模型。“源1.0”的模型结构与GPT-3类似,但参数量达到了2457亿,比GPT-3还要多,是全球最大规模的中文语料AI巨量模型。截至目前,“源1.0”大模型开源开放平台注册开发者已达3000多名。

三六零:

武超则提出的第二层是做大模型的公司,百度是其中的佼佼者。在A股中,与百度极为相似的三六零被寄予厚望。

三六零大家都不陌生,旗下的360搜索在中国搜索引擎市场排名第二,市场份额达35%。除了360搜索,三六零还拥有对标百度知道、Reddit的360问答以及对标百度百科、维基百科的360百科。这些资源为三六零提供了海量的训练数据,使得三六零天然具备数据清洗和数据迭代的核心功能。

算法模型方面,根据公司在互动平台上的回答,三六零从2020年开始一直在包括类ChatGPT、文本生成图像等技术在内的 AIGC 技术上有持续性的研发及算力投入,目前公司的类 ChatGPT技术的各项指标已实现强于GPT-2的水平,并在中文语境下实际效果强于GPT-2。

算力方面,截至2022 年半年报,三六零拥有货币资金超200亿,具备充足的资金储备应对算力竞赛。

科大讯飞:

武超则提到的第三层是在垂直行业上有更多积累的公司。

科大讯飞作为国内认知智能领域的领军企业,长期深耕教育、医疗等领域,在相关垂直行业有强大的数据积累。

算法模型方面,科大讯飞在Transformer深度神经网络算法方面拥有丰富经验,开源了超过40个通用领域、6个大类的系列中文预训练语言模型,成为业界最广泛流行的中文预训练模型系列之一。值得一提的是,GPT模型也是基于Transformer深度神经网络算法而发展起来的。

算力方面,科大讯飞自建有业界一流的AI数据中心,实现了百亿参数大模型推理效率的近千倍加速,为大模型训练平台建设奠定了很好的硬件基石,为未来更大更多认知智能大模型技术经济实惠规模化应用提供了可能。

长期从事科技公司投资的资深市场人士对价值线研究员分析说:科技板块可能是未来三年A股最活跃的力量。GhatGPT已点燃又一场技术革命的烽火,其未来巨大的市场空间将被一次又一次拓开。目前行业就像五年前清洁能源的锂电光伏,其大小龙头公司将沿着大涨小回再涨波浪前进,一些十倍公司将脱颖而出。这一切值得A股投资者耐心持续关注。

本文源自价值线


免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com