企查查全球首发商查大模型“知彼阿尔法”,构建安全可信人工智能
近年来,人工智能已成为全球数字技术创新最活跃的前沿之一、数字经济新赛道和国际竞争新热点。 与此同时,公众对人工智能的质疑并未消失。 如何在踩加速器的同时掌控速度和方向,从而构建安全可信的人工智能产业生态,探索基于可信数据的AIGC(生成式人工智能)。 已成为未来人工智能突破的重要方向。
而近期发布的全球首个大规模商业搜索模型——企查查“知彼Alpha”,不仅是对可信人工智能的有益探索。 这个大模型是基于查查企业在业务查询领域近十年可信数据积累后进行大规模预训练的结果。 即将推出的创新产品将通过大模型+企业信用数据库共同构建,并由AI技术赋能。 启信大数据创新打造安全可信的人工智能产品,为用户提供更加便捷、准确的商业信息查询服务。
(图:企查查、商查大型模型“智彼阿尔法”)
为什么业界首个商业搜索大规模模式叫企查查?
据悉,今年5月20日江苏发展大会期间,企查查创始人陈德强带来全球首个大型商业搜索模型“知彼Alpha”并开展现场路演,引起业界关注。
(图:2023年5月20日江苏发展大会上,企查查发布全球首个大规模商业搜索模型“知敌Alpha”)
陈德强表示,企查查拥有覆盖全球近5亿企业的企业信用数据库。 商事信息查询服务的核心资源是相关数据资源,如商事信息、诉讼信息等。而且,数据覆盖面必须足够广泛,不仅是中国的全数据,还包括周网边其他国家的数据。世界。 此外,在企业招投标、企业尽职调查等专业性较强的领域,也有必要建立专门的数据库。 将AIGC技术引入商业信息查询服务领域,最关键的动作是利用企业信用数据集训练相关模型。 数据量越大,数据质量越高,最终训练出来的模型就越准确。 与其他主要使用公共互联网数据集的大型语言模型相比,商业、司法等专业数据的获取难度更大。 可以说,企查查覆盖的5亿企业征信数据资源是企查查商查服务的核心壁垒,汇聚了目前国内市场80条产业链、8000个行业、大量实时工商信息。市场上的数据。 信息、风险揭示、知识产权、信用报告、股权关系等300+维度的企业信用数据。 这些数据不仅为企业搜索构建了较高的竞争壁垒,也为训练智彼Alpha企业搜索模型奠定了坚实的数据基础。
据了解,企查查的AI算法模型国内领先,并于今年5月荣获“中国智能科学技术最高奖”吴文俊人工智能科学技术奖。 在算法层面,企查查有着深厚的AI技术积累。 多年来,企查查利用深度学习、自然语言处理(NLP)等AI技术,实现了全球海量多语言文本的自动化和智能化。 数据分析和文本挖掘可以进一步实现深度语义分析,为用户提供更精准的语义检索服务。 在预训练模型领域,由于拥有丰富的数据资源,企查查已经具备了深厚的技术积累。 企查查此次发布的智彼阿尔法尚查大模型,已实现完全自主知识产权。
丰富多样的产品服务和应用场景。 用户直接面对的是产品,而不是技术。 因此,要将AIGC底层的大规模模型技术应用到商业搜索服务中,需要将该技术封装成易网于用户使用的产品。 而且,根据不同的用户需求,需要打造有针对性的产品,进而形成比较完整的产品矩阵。 以产品矩阵的形式为商业搜索用户提供一站式服务。 在产品层面,企查查针对不同用户群体构建了完整的产品矩阵。 具体来说:针对企业用户,企查查提供定制化服务,提供精准获客、企业评级、尽职调查、风控、司法调查、舆情监测、供应链管理等场景的解决方案,协助企业用户提升企业形象、交叉核对信息、寻找合作伙伴; 针对个人用户,企业查查提供投资、融资、求职、风险判定等场景的解决方案,为个人用户洞察企业股权结构、规避企业识别过程中的信用风险; 为地方政府政策制定、社会信用体系建设、投资促进、政策支持对象筛选、企业信用监管等提供重要参考。
为什么要构建业务检查版本?
随着数据量的积累和产品功能的增加,商业搜索领域出现了很多问题和需求痛点,主要表现在两个方面:
用户还处于关键词搜索阶段,平台无法很好地理解用户复杂的业务需求。 目前,大多数企业搜索平台本质上都是企业信用信息领域的搜索引擎。 用户通过关键词在企业信用数据库中搜索对应的企业或风险信息,难以表达用户复杂、结构化的需求。 例如,某学校食堂希望在招标过程中了解供应商的食品安全风险。 使用以前的商家搜索产品时,一般需要先输入参与竞价的公司名称,然后跳转到对应公司的主页,然后搜索该公司“才能确定是否公司存在食品安全风险,环节较多,对新用户不友好,如果用户还想了解该企业法人经营的其他餐饮企业是否发生过重大安全事件?是否有关联公司随行类似于这些更深入的需求,通过简单的检索信息很难快速满足用户,即使能够实现需求,用户也需要具备相关的专业知识,能够掌握商查的搜索功能熟练掌握平台,经过多步相对繁琐的操作,终于可以得到更深入、更完整的公司信息,但对于绝大多数新用户来说,使用门槛太高,不利于开拓信息渠道更加广泛。
另外,在搜索引擎模型中,商业搜索平台反馈给用户的是大量的基础数据,而不是直接的答案。 如果是大型集团公司,可能有数万条企业信用基础数据,如此巨大的浏览量对于用户来说是一个很大的负担。 这种商业信息查询服务还处于工具阶段,还不能称为强大的商业助手。 同时,企查查拥有、、、、信用大数据、风险大数据等上百种产品和服务,用户系统学习和掌握有一网定难度。 即将推出的对话产品可以跳过繁琐的搜索步骤,利用对话充分释放企业各类产品的能力,为用户提供“一体化、易懂、高价值”的商业信息服务。
然而,如果用户使用等大语言模型搜索高价值的企业信用数据,就会发现明显的问题:由于缺乏专业数据库支持,搜索到的企业业务和信用数据均来自公共互联网。数据,并且无法保证数据。 准确性。 同时,一些高质量的商业企业信用数据库并不向他们开放。 缺乏专业数据库的支持,对. 知彼Alpha商业搜索模型基于企查查全量可信数据进行深度训练,可以为用户提供专业的企业信用数据和多元化的分析结果。
AIGC+企业信用数据库,商业搜索服务进一步进化
随着人工智能进入“AIGC时代”,陈德强认为,它将彻底改变数据的查询和使用方式。 “行业数据规模达到一定程度后,数据查询方式发生了变化,AIGC+企业信用数据库可以充分利用数据。” 第一个大规模商用查询模型,基于企业查查覆盖的全球企业信用数据训练而成。 与传统商茶平台相比,基于智彼Alpha商茶大规模模型的后续产品实现了以下三点变化:
在人机交互方面,利用自然语言对话可以完成复杂的查询步骤。 当用户想要查询某些业务数据时,不再局限于关键词搜索,而是可以使用自然语言描述来提出自己的需求,降低用户门槛。 例如,当用户想要对某家公司进行浅层尽职调查时,可以询问“某家公司的行业地位如何?竞争对手有哪些?” 智彼Alpha模型会从用户的描述中了解自己的需求,并将需求“解构”成相应的指令。 这样,当用户在了解一个公司时,知彼Alpha模型就像一个专业的商业研究助手,而不是一个没有智慧的工具。
在技术方面,实现了对用户需求的秒级响应。 知彼Alpha的大模型能够根据用户语义检索企业信息数据,然后将“整理、汇总”的结果呈现给用户。 在这种情况下,用户得到的不再是一堆零散的信息,而是一个完整的答案。 为了提高响应速度,智彼阿尔法的大模型已全面接入企业超算平台,查询、浏览、汇总、结构化输出等繁琐步骤可在秒级内完成。
全新的“多轮对话”功能,让商业搜索平台具备了逻辑思考的能力。 知彼Alpha大模型的“多轮对话”功能是该模型相对于以往企业恰恰对话式AI的优势亮点之一。 有了这个能力,知彼Alpha大模型可以通过多轮对话逐步引导用户进行更深入的分析。 在多轮对话中,用户可以根据已经得到的结果提出新的指令,从而提出更深入的问题。 这样,智彼Alpha模型不仅成为用户的助手,还充当“路径指南”,引导用户一步步寻求答案。
中国信息通信研究院《企业信用大数据产业发展研究报告》显示,在行业用户规模、数据量等规模指标上,企查查位列行业第一。 在产品用户粘性方面,企查查的人均使用时长和人均每日启动次数也高于行业总体水平。 此外,从行业渗透率来看,企查查在法律行业和泛金融行业的渗透率分别为50.1%和41.2%,保持行业领先地位,排名第一。
广告声明:本文所包含的外部跳转链接(包括但不限于超链接、二维码、密码等)用于传达更多信息并节省选择时间,结果仅供参考。 IT之家所有文章均包含此声明。