首个千亿中文语言模型的使命,不止于规模与刷榜成绩

首页    产品技术    首个千亿中文语言模型的使命,不止于规模与刷榜成绩

 

此前公布超大规模预训练语言模型的开发计划时,我们强调,它是面向产业落地应用的,而非纯粹的学术研究项目。

 

两者的区别是什么?

 

首先,为学术研究而生的大规模预训练模型,往往以人工收集构造的相对通用化的数据集作为基准,以较理想化的设定来进行实验(比如类别均衡的多分类问题),这些都跟模型最终的实际落地应用有明显出入。因此,我们必须从开始打造它的第一天起,就考虑大模型将来怎么在企业级应用中落地。

 

其次,以单纯学术研究为目标的大模型,到了刷新榜单最好成绩这一步,就拿了研究项目的高光时刻,并不需要参与后面漫漫无期的落地应用过程。但对我们而言,只能高兴一天时间。还是同一批人,不是把孩子生出来就行了,还要负责养大,培养孩子做出最大的贡献。

 

▲余承东发布由循环智能和华为云联合开发的盘古NLP模型

 

循环智能(Recurrent AI)联合创始人杨植麟是“大模型”的布道者,也是深入业务前线的公司产品负责人,因此非常关注前沿AI技术的落地策略。他认为,“超大规模模型是价值最大化的基础,但刷新CLUE榜单成绩只是模型能力的初步验证,盘古NLP大模型更大的价值是带来AI落地的效率革命和应用场景扩展。”

 

三大技术创新,专攻大模型落地难题

 

在盘古NLP大模型研发过程中,循环智能的 NLP Moonshot 团队拆解了GPT-3等大模型很难在商业场景中得到应用的三大原因:1)大模型在应对复杂商用场景的小样本学习能力弱;2)难以结合微调扩展业务场景;3)难以融入不同领域的知识。然后,一一进行击破。

 

第一,盘古NLP大模型在小样本学习任务上超越GPT-3,解决后者难应对复杂商用场景的少样本学习问题。比如在企业客户的心声分析和员工执行力分析应用场景中,使用盘古NLP大模型生产语义标签时,实测得到目标结果所需的样本量仅为GPT-3模型的十分之一,即AI生产效率可提升十倍。

 

 

第二,盘古团队在预训练阶段加入了基于 prompt 的任务,大幅降低微调难度,解决以往大模型难为不同行业场景进行微调的问题。在下游数据充足时,微调难度的降低使得模型可以随着数据变多而持续优化;在下游数据稀缺时,微调难度的降低使得模型的少样本学习效果得到显著提升。比如,在企业借助沟通内容判断客户购买意向,以找出更多目标客户从而提升转化率的场景中,实测盘古NLP大模型相比GPT-3可提升 27% 的成单转化率。

 

 

第三,除了能像GPT-3等仅基于端到端生成的方式以外,盘古NLP大模型还可以通过少样本学习对意图进行识别,转化为知识库和数据库查询,解决以往大模型难融入行业知识和数据的问题。比如在金融服务场景中,盘古NLP大模型能更好地为实时沟通辅助系统提供底层能力,帮助服务人员更快掌握专业知识和沟通经,更快提升业务水平。

 

 

三种企业应用,增强“人”的能力

 

在高附加值的产品销售与服务过程中,如保险、房产、教育、财富管理等行业,企业需要借助人与人之间的沟通过程,让销售人员与客户建立更紧密的联结,提供更专业的服务。但由于销售人员的素质和能力提升缓慢,同时企业缺乏对目标客户的了解,导致客户体验不佳,业绩也难获增长。

 

“企业的员工在与消费者沟通交流时,代表的是企业自身形象。因此,提升员工的业务水平和表现,是企业重塑消费者体验的重要环节。”循环智能CEO陈麒聪表示。

 

基于盘古NLP大模型等核心技术,循环智能(Recurrent AI)为企业提供人员产能提升、精准销售和新一代合规质检解决方案,帮助企业更快地提升销售人员能力、更快地找到目标客户以及降低合规风险。

 

人员产能提升(Expert):借助深入业务流程的优秀实践挖掘、沟通实时辅助和执行监督报表产品组合,帮助企业将优秀销售人员的实践经验传递给每一名普通销售。在与客户沟通中实时辅助销售人员,提升他们的表现,将他们为企业创造的价值最大化。

 

精准销售(Target):循环智能开创了基于沟通对话数据与成单结果的意向预测模型,通过算法模型,可筛选存量线索中的高意向线索,或筛选对某产品更感兴趣的客户名单,帮助销售人员更精准地找到目标客户,提升销售和服务效率。

 

新一代合规质检(Compliance):不同于基于“关键词+正则”的传统方案,循环智能提供高准确率和召回率的AI语义质检方案,配合独家的“违规率排序”功能,可助力质检员多找出数倍违规对话,帮助企业大幅降低合规风险,提升服务质量。

 

截止2021年4月,循环智能(Recurrent AI)已服务了银行、保险、在线教育、房产和消费金融等领域的众多行业标杆客户,包括招商银行、人保财险、太平洋保险、招商信诺、水滴、新东方在线、51Talk、豌豆思维、万科、我爱我家、安居客和捷信等。

 

欢迎加入我们,一起奔赴前沿NLP技术与落地应用的交汇点,或许困难重重,但我们做好了全力以赴的准备。

© THE END

 


 

关于循环智能

循环智能(Recurrent AI)是一家 AI 企业服务公司,借助原创的自然语言处理和深度学习技术,帮助中大型企业充分挖掘对话数据的价值,提升员工产能,带来业绩增长。公司服务的客户主要在保险、银行、房产和在线教育等领域。创始团队来自清华大学、卡内基梅隆大学,并获得红杉资本中国基金、真格基金、金沙江创投、靖亚资本等知名投资机构的支持。2021年,循环智能入选CB Insights 年度“AI 100全球榜单”。2020年,循环智能获得高新技术企业认证,并被德勤Deloitte评选为“中国明日之星50强”。2019~2020年,循环智能连续两年入选《机器之心》年度“最具产业价值”榜单。

 

2021年4月28日
浏览量:0