开源模型+行业数据:AT&T与GSMA用Gemma给电信AI趟路

通用大模型在电信行业根本跑不动。问题核心在于电信领域的数据极度稀缺且高度私密,没有公开的“电信百科”可供训练。多供应商、多数据结构的复杂网络导致通用模型缺乏理解核心业务所需的基础上下文,连专业术语和网络拓扑都搞不定。结果是仅有16%的AI部署真正用在了网络上,行业急需专精模型来解决自动化和智能运维的痛点。

GSMA牵头搞了Open Telco AI平台,AT&T基于谷歌开源的Gemma模型进行了后训练,开发出名为OTel的电信专用模型家族。核心做法不是从零训练,而是用GSMA联合运营商、设备商和学术界整理的专属数据集进行微调。关键是,这些模型内置了基于RAG的“弃权”机制,不知道的就回答不知道,极大降低了幻觉风险,这在通信这种不能出错的行业是生死线。最终产出了30个不同尺寸的模型,其中Gemma 3 27B参数版本在测试中达到了91.74%的准确率,效果拔群。

这个案例的价值远不止于电信。它验证了一个关键路径:用开源基座模型+行业私域数据微调的小模型,能在特定领域轻松击败参数量大得多的通用大模型。这其实为所有垂直行业打了个样——金融、医疗、法律这些数据敏感且专业的领域,都可以复制这种模式。未来的AI竞争力不在于谁有最大的模型,而在于谁掌握了最稀缺、最干净、最安全的领域数据,以及谁能把领域知识高效地注入到开源模型里。

Open models, global networks: How AT&T and GSMA are accelerating innovation with Gemma

查看原文