大模型“百轲争流” 唯有“奋楫者”才能扬帆远航

首页 > 评论 > 正文

2023-07-10 17:26:29 来源：关灯

原标题：大模型“百轲争流” 唯有“奋楫者”才能扬帆远航

近日，在多场重要的科技盛会上，大模型均占C位。数十个大模型悉数登场，相关应用在各行业逐步垂直渗透，数字人、智能舱等“百花齐放”。国内多模态等各类大模型技术路线并行突破，产业链芯片、算力等关键技术市场蓬勃发展，更多企业联合探路。

随着在国内热度持续上涨，大模型“百轲争流”，呈现蓬勃发展态势。科技部新一代人工智能发展研究中心发布报告显示，上半年我国10亿参数规模以上的大模型已发布79个。根据上海市人工智能学会数据，截至目前，我国大模型已近百个，可谓真正进入了“百模大战”。下半年国内还将进入大模型发布的密集期。

热闹之下，国内大模型也必须直面灵魂拷问。

首先，能否烧得起？大模型需要庞大的算力支持，同时也带来巨大的成本压力。有专家直言，ChatGPT大模型每训练一次，相当于报废了3000辆特斯拉汽车。众多企业陷入一边疯狂烧钱短期内难以覆盖预训练成本，一边模型商业化难以落地的困境之中。

其次，可否规模商用？当下大模型仍有局限性，存在效率低、涉嫌侵犯数据隐私和知识产权、高端人才匮乏等问题。业内认为，大模型效率需得到10倍以上的提高，大规模商用才有可能。

再次，如何避免过度？在庞大的模型数量和种类之下，存在一些过度现象。部分企业追求炫技忽视应用可行性，部分追求模型“规模大”而堆叠参数，更有部分企业或机构追求“参数高”过度训练，导致大模型过拟合和泛化能力不足。

面对挑战，国内大模型“航船”该如何顺利“渡江”？

其一，注重前端技术，勇攀“芯”高峰，深耕算力。企业在关键技术道路上勤耕不辍，探索新的预训练架构、方法，进一步提升大模型的性能和效率，推动国内大模型与国际接轨，让大模型真正成为企业参与全球AI大模型竞争的重磅“船票”。鼓励创新创业，让开发者设施可以站在巨头肩膀上创造未来。

其二，推动产业链联动，扩大开放开源生态。大模型热带来了算力、国产芯“创新架构+开源生态”的新机会。行业通过共建开放生态，鼓励产业链共享和合作，从而减少重复建模。企业也可通过收购、孵化等方式，扩大自身在行业影响力和市场份额。

其三，加强模型评估和验证。机构及企业应建立评估标准和机制，规范模型开发和应用过程，避免过度夸大模型的能力，防止炒作，注重大模型可解释性和可理解性，使其在实际应用中更加可信、可靠。

大模型“百轲争流”后是大浪淘沙，只有真正的“奋楫者”，才可以勇立潮头扬帆远航。（贾丽）

大视野融媒网（原大视野新闻网）是最富价值的互联网推广平台，致力于打造国内最有影响力的融媒体发布平台。

大视野融媒网版权与免责声明：

一、凡本站中注明“来源：大视野融媒网”的所有文字、图片和音视频，版权均属大视野融媒网所有，转载时必须注明“来源：大视野融媒网”，并附上原文链接。

二、凡来源非大视野融媒网的新闻（作品）只代表本网传播该消息，并不代表赞同其观点。

如因作品内容、版权和其它问题需要同本网联系的，请在见网后30日内进行，联系邮箱：dsynews@126.com。

为你推荐