AI大模型工具步入Long-LLM新时代,长文本处理能力爆表提升!

2022年9月,中国创业公司月之暗面推出通用人工智能(AGI)大模型Kimi Chat,业界震撼!升级到200万字参数量,让行业为之瞩目。短短五个月后,中国另外两大科技巨头阿里和百度再接再厉,分别发布了各自的大模型工具升级消息,直击长文本处理的痛点,开启了名为”长文本处理能力”的“内卷之战”!
9月份,中国首家运用通用人工智能技术的大型企业,月之暗面公司公布了他们旗下的Kimi Chat模型最新进展,这不仅在技术上进行突破,更是首次将其扩张到了200万字的巨大指向性!而在这个月里,Kimi Chat已经震撼了整个市场,引发了细分赛道如长文本大模型(Long-LLM)的竞争热潮!
仅仅过了几天,阿里巴巴也毫不示弱,发布了名为“通义千问”的大模型工具的震撼升级,此举为所有人打开了高达1000万字的长文本处理大门!而且更为激动人心的是,这次升级竟然是全免费的!对那些极度依赖长文本分析的行业来说,如金融、医疗和科研工作人员等,无疑是意味着巨大的便利,可以大大缩短提取关键信息所需的时间。

d2b5ca33bd20240324131923

紧接着,全球知名互联网搜索引擎百度也传来好消息,他们的大模型文心一言即将在下个月释放免费的200万至500万字的长文本处理神器,足以与最先提出这项服务的Kimi Chat匹敌!
这波“内卷风”不只吹拂到了国界,还席卷了美国!近日,著名的互联网安全公司360也发射了自主研发的AI搜索软件–360 AI搜索,同时,又给出了长文本处理技术彻底重构的革命性解决方案。
如此来看,挑战自我,超越自我,成为了这些巨头们争夺市场份额的主旋律!他们的目标不仅仅在于“我能做”,而是要做到“我必须做到”,对此我们拭目以待!
再转头看回我们的主角,即所谓的“热门技术”–长文本!作为一种具有挑战性的任务,如何在数百万字内高效地梳理信息,整理观点,都是各类巨头们极度关注的话题。这其中充满了技术难度,就像半导体行业与消费电子产品市场一样,人们使用手机或电脑时虽然感受到性能飞速提高,但实际体验的改变仿佛并不明显。

大规模模型,英文名Large-Scale Model,简称LM。这个奇妙的物质之所以神奇,就在于它具极其强大处理力。它可以根据其生成的token数目来评估不同区域token值各不相同其中,1km token就相当于750个英文词汇或500个中文汉字。比如说,ChatGPT-4的参数量就高达8k~32k token;再比如,Anthropic公司的Claude拥有震撼性的100K token,可想知,这样的规模对于处理大量文本信息来说简直就是完美的选择。

就在前不久,为了向广大用户展示大模型的威力,中国一家初创企业——月之暗面带来了他们新产品KimiChat,这个拥有400K token的模型可以短短20秒内阅读完毕长达20万字的长篇小说。甚至连通文千义也在了鸿篇巨著长达80万字的《三体》,这真是令人惊叹的速度啊!

部分资料借鉴:百度

THE END
© 版权声明
146人围观 !
点赞14 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容