AI大牛周明发布MChat:生成可控,参数范围可担负,顺便官 ...

2023-3-21 09:30| 发布者: 夏梦飞雨| 查看: 123| 评论: 0

摘要: 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 大模型赛道又有融资新动态:言语大模型玩家 澜舟科技,刚刚完成了Pre-A+轮融资。 本轮融资由北京中关村科学城公司领投,斯道资本和创新工场跟投。这是澜舟科技1年内收获的 ...

衡宇 发自 凹非寺


量子位 | 公众号 QbitAI


大模型赛道又有融资新动态:


言语大模型玩家 澜舟科技,刚刚完成了Pre-A+轮融资。


本轮融资由北京中关村科学城公司领投,斯道资本和创新工场跟投。这是澜舟科技1年内收获的第2轮融资,2轮累计总额数亿元。


不止于此。和融资音讯一同发布的还有澜舟科技推出的言语生成模型, 孟子MChat可控大模型


它有类ChatGPT的才干,加上原来澜舟科技孟子大模型N个项目功用引擎,最终呈现出来的MChat,既有对话才干,又具备翻译、生成、信息搜索等才干。


关于MChat,澜舟科技开创人兼CEO周明还作了如下引见:


  • 将陆续推出10B和100B参数级的大模型;
  • 具备聊天、问答、翻译、文本生成、信息抽取等多种才干;
  • 可融合搜索结果、范畴数据和学问图谱;
  • 对功用、作风、人类认知等方面具可控性。


孟子MChat可控大模型


本次融资是创新工场对澜舟科技的“继续跟投”。


创新工场董事长兼CEO李开复在3月14日的趋向分享会上谈到,AI曾经来到从1.0迈入2.0的拐点。


顺着这个思绪,MChat能够视为澜舟科技尝试从 平台基础设备两个层面迈入AI 2.0时期的细致动作:


首先,发布迭代而来的孟子MChat可控大模型,视其为通用底座,提供言语预锻炼模型、多模态预锻炼模型、垂直范畴预锻炼模型等才干。


其次,再在其上架构才干平台,提供学问图谱、辅助写作、机器翻译等模块化才干。



据周明引见,团队走访了100多家公司,发现市场需求悬殊。这种状况下,澜舟科技以为在更垂类的赛道做定向优化显得尤为重要。


也因而延伸出孟子大模型技术体系的特性之一, 更多样化


细致而言,就是孟子支持BERT (剖析类)、GPT (生成类)和T5 (翻译类)等架构,能够掩盖阅读了解、文本生成、机器翻译、对话等不同场景。


值得留意的是,MChat固然具有ChatGPT同样的对话才干,但两者有所不同。


ChatGPT尽可能将多模态数据归入锻炼,数据量越大越好,不甄别数据好坏;


而MChat强调 “可控性”


一是 功用可控,即依据细致需求加减可调用的细致功用;二是 结果可控,保障输出内容的健康、良性。


“未来我们是想继续探求从AI 1.0到2.0到AGI,”周明说,“不外AGI有点太远,但下一步曾经肯定,就是从单言语扩展到更多的言语。”


选择在这个时间点进军AI 2.0时期,澜舟科技似乎天时缺乏,放眼大模型创业范畴,千帆竞赛;但益处是已有诸多铺垫,且孟子轻量化模型的才干 曾经经过考证


MChat背地依托的 孟子大模型,是澜舟科技自研技术研发的大范围预锻炼言语模型,于2021年7月推出。


可处置多言语、多模态数据,同时支持多种文本了解和文本生成任务,快速满足不同范畴、不同应用场景的需求。


与追求打造AGI不同,基于Transformer架构的孟子,行进道路是 轻量化——仅包含10亿参数。


靠这10亿参数,孟子大模型在中文言语了解范畴最具权威性的测评基准 CLUE上多次刷榜第一,四两拨千斤,击败其他公司百亿以至千亿的模型。


到细致的应用层面,同花顺、华夏基金为代表的金融范畴,以及中文在线代表的文案写作范畴,澜舟科技都以孟子大模型为底座提供了才干支撑。


NLP大牛周明


澜舟科技是以NLP技术为基础的认知智能公司,由AI大牛 周明兴办的公司,成立于2021年6月。


周明,当今NLP范畴成就最高的华人之一,他不只是中国第一个中英翻译系统的研制者,还在2019年成为AI言语范畴最高级顶会ACL (国际计算言语协会)主席。


1991年在NLP重镇哈工大拿到博士学位后,周明进入清华任教;1999年被微软亚洲研讨院开创院长李开复挖走,后来不久成为NLP研讨组担任人。



2020年分开MSRA加盟创新工场担任首席科学家时,周明已担任MSRA副院长多年。


从工作21.5年的MSRA出走的缘由,周明有些戏谑地解释:


“2020年年底,我隐隐约约感知到未来 大模型要兴起,所以毅然毅然分开微软,成立澜舟科技,特地从事大模型研讨。”


据引见,除了孟子大模型外,目前澜舟科技 曾经开源了近20个大模型


假如真如李开复所说,AI来到了从1.0过渡到2.0的拐点,这对NLP意味着什么?


周明一边提到,AI 2.0反映在NLP,能看到GPT这样的通用模型,一套模型处置很多问题,效率大幅提升;一边又提出了 两个现象


一是AI 2.0时期的NLP才干足够强,在处置新任务时只需用一个提示词来替代它的才干;


二是模型大到一定水平时,会涌现新的才干,特别是会爆发出一些从未见到过的才干。


他个人表示出 对新才干涌现的格外关注,由于涌现这件事目前还是未解之谜,“独一能启迪你的是在才干范围之内,尽量把模型做的比较大”。


ChatGPT身上的逻辑和思想才干,就是由GPT系列模型的鼎力出奇迹出品。既然如此,澜舟科技会不会也在模型参数上加码?


周明开门见山地回答, 澜舟不会去追从千亿、万亿大模型


我们会威严重模型,把模型做到相当大,但同时快速思索它的落地。



关于大牛周明和他对大模型的最新思索,欢送锁定3月29日量子位举行的中国AIGC产业峰会,周明博士曾经确认列席并带来最新思索。


联络作者



3月29日「中国AIGC产业峰会」


抢票开启


「中国AIGC产业峰会」定档3月29日,线下会场抢票开启!


百度 袁佛玉、智源 林咏华、澜舟科技 周明、小冰 徐元春、科大讯飞 高建清、启元世界 袁泉、云舶科技 梅嵩、特赞 王喆、微软 关玮雅、源码资本 黄云刚、元语智能 朱雷、无界Ai 马千里、Tiamat 青柑、峰瑞资本 陈石等来自产学研界大咖嘉宾,还有重磅嘉宾陆续确认中。


扫描下方二维码,报名峰会线下会场啦~


点这里 关注我,记得标星哦~


一键三连「分享」、「点赞」和「在看」


科技前沿停顿日日相见 ~



路过

雷人

握手

鲜花

鸡蛋

 万奢网手机版

官网微博:万奢网服务平台

今日头条二维码 1 微信公众号二维码 1 抖音小程序二维码 1
上海万湖珠宝贸易有限公司 地址:上海市宝山区共和新路4727号新陆国际大厦1003-1007室 网站经营许可证 备案号:沪ICP备11005343号-12012-2019
万奢网主要专注于手表回收,二手名表回收/销售业务,可免费鉴定(手表真假),评估手表回收价格,正规手表回收公司,宝山实体店,支持全国范围上门回收手表
返回顶部