中国试图主导人工智能世界的努力可能会取得成效,业内人士和技术分析师告诉CNBC,中国的人工智能模型已经非常受欢迎,在性能方面与美国的模型保持同步,甚至超过美国的模型。
人工智能已成为中美之间的最新战场,双方都将其视为战略技术。华盛顿继续限制中国获得旨在为人工智能提供动力的尖端芯片,担心该技术可能威胁到美国的国家安全。
这促使中国采取自己的方式来提高其人工智能模型的吸引力和性能,包括依赖开源技术和开发自己的超高速软件和芯片。
*中国正在创建受欢迎的大型语言模型*
与该领域的一些领先美国公司一样,中国人工智能公司正在开发所谓的大型语言模型(LLMs),这些模型接受了大量数据的训练,并为聊天机器人等应用程序提供了基础。
然而,与OpenAI广为受欢迎的ChatGPT提供动力的模型不同,许多中国公司正在开发开源或开放权重的的大型语言模型(LLMs),开发者可以免费下载并在其上构建,而不需要发明者提供严格的许可要求。
Hugging Face的机器学习工程师王铁真(Tiezhen Wang)表示,在Hugging Face大型语言模型知识库上,中文大型语言模型的下载量最高。他说,通义千问(Qwen)是中国电商巨头阿里巴巴创建的一系列人工智能模型,在Hugging Face上最受欢迎。
王铁真通过电子邮件告诉CNBC:“通义千问因其在竞争基准上的出色表现而迅速受到欢迎。”
他补充说,通义千问有一个“非常有利的许可模式”,这意味着它可以被公司使用,而不需要“广泛的法律审查”。
通义千问有不同的大小或参数,正如大型语言模型世界所知的那样。大参数模型更强大,但计算成本更高,而较小的模型运行起来更便宜。
“不管你选择什么尺寸,通义千问都可能是目前市面上表现最好的模型之一。”王铁真补充道。
初创公司DeepSeek最近也因一款名为DeepSeek- R1的模型引起了轰动。DeepSeek上个月表示,它的R1模型与OpenAI的o1模型竞争,o1是一种用于推理或解决更复杂任务的模型。
这些公司声称,他们的模型可以在各种功能上与Meta的Llama等其他开源产品以及OpenAI等封闭式LLM竞争。
Lux Capital合伙人格蕾丝·伊斯福德(Grace Isford)通过电子邮件告诉CNBC:“去年,我们看到中国对人工智能的开源贡献正在崛起,它们的性能非常强劲,服务成本低,吞吐量高。”
*中国推动开源走向全球*
开源一项技术有很多目的,包括推动创新,因为更多的开发人员可以使用它,以及围绕产品建立社区。
并非只有中国公司推出了开源大型语言模型。Facebook母公司Meta以及欧洲初创企业Mistral也有开源版本的人工智能模型。
但是,随着科技行业成为华盛顿和北京之间地缘政治斗争的焦点,开源大型语言模型给中国公司带来了另一个优势:使他们的模式能够在全球范围内使用。
全球咨询公司DGA Group的合伙人保罗·特里奥罗(Paul Triolo)通过电子邮件告诉CNBC:“中国公司希望看到他们的模型在中国以外得到使用,所以这绝对是公司在人工智能领域成为全球参与者的一种方式。”
虽然目前的焦点是人工智能模型,但关于将在其基础上构建哪些应用程序,以及谁将主导未来的全球互联网格局,也存在争议。
Lux Capital的伊斯福德表示:“如果你认为这些前沿基础人工智能模型是赌注,那么关键在于这些模型的用途,比如加速前沿科学和工程技术。”
如今的人工智能模型被拿来与微软(Microsoft)的Windows、谷歌的Android和苹果的iOS等操作系统进行比较,它们有可能主宰一个市场,就像这些公司在移动和个人电脑领域所做的那样。
如果这是真的,那么建立一个占主导地位的大型语言模型的风险就会更高。
“他们(中国公司)将大型语言模型视为未来科技生态系统的中心。”伦敦国王学院(King’s College)中国和东亚商业高级讲师孙欣(Xin Sun)通过电子邮件告诉CNBC。
“他们未来的商业模式将依赖于开发者加入他们的生态系统,开发基于大型语言模型的新应用程序,并吸引用户和数据,从而通过各种方式产生利润,包括但远远不止是引导用户使用他们的云服务。”孙大型语言模型补充说。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com