九游娱乐它想给AI搜索醒醒脑

技术百科 小编 发布时间:2024-07-22 浏览:

  九游娱乐地址在加利福尼亚州旧金山,日期是7月16日。一个专门研究如何在人工智能时代改进搜索的实验室,Exa,宣布:融到2200美元。

  这笔钱Lightspeed Venture Partners带头。还有英伟达(NVIDIA)的风险投资部门和Y Combinator也参与投资;目的是帮助Exa快速发展,打造一个全新的搜索引擎,专门服务于人工智能。

  什么?帮助人工智能,打造全新搜索?是的,你没听错。他们要给人工智能加个“外脑”,或者说,在搜索功能上加点新东西,让AI搜索更强进。

  这让我很好奇,Exa到底是个什么样的公司?有什么特别的技术?创始团队背景是怎样的?为什么这么多资本投他们?

  最开始,Exa构建一个工具,这个工具能让人工智能模型做类似网络搜索的事情。

  创始人早些年花100万美元买了GPU,他们使用矢量数据库和嵌入技术(这不是基于经典Transformer的大型语言模型),开始建立一个机器学习模型,模型被训练来本能地理解链接,而不是单个的词或句子。

九游娱乐它想给AI搜索醒醒脑(图1)

  我们是看大家在网上分享什么链接,来训练搜索引擎,所以,是一种全新的方式,不同于一般的搜索引擎只根据关键词来找东西。

  就像大型语言模型通过提供最有可能的下一个单词来完成句子一样,Exa的系统会提供最有可能的链接(可能是十个)。

  结果,当ChatGPT爆火之后,很多人工智能公司开始向Exa请求他们的搜索引擎API版本,以便能将用到自己的模型中去。

  之后事情就一发不可收拾了,现在已经有数千名开发者在使用我们的产品,客户也越来越多,从那以后,Exa获得了极大的关注。

  尤其是谷歌搜索,在谷歌,有一整个行业叫做搜索引擎优化(SEO)。这个行业目的,是用各种技巧让网页在搜索结果里排名靠前,这样就能吸引更多人的注意。

  结果就是,哪怕你只是简单地想知道“感冒了怎么办?”你也会看到一大堆网站在争抢排名,而不是真的提供最有用的信息。

  显然,搜索引擎不只是为个人使用,更多是为AI搜索服务的;实际上个人也可以用。

  我也可以不点进去,直接把鼠标悬停在标题上,右侧就会出现一个摘要,自动形成一个总结文档。

  进行多轮测试,可以肯定,只要点击“新闻”,显示出来的都是引用自各大媒体的报道,比如华尔街新闻、TechCrunch等。

  域过滤器可以限定搜索范围,只在特定的文档字段或域中进行搜索,这可以提高搜索的精确度和效率。

  不过,一个缺点是并没有给我直接的答案。可能是因为关于Exa的报道本身就较少,所以它没法自己创造内容。

  我也遇到一个问题,当我搜“IPD是什么”时,它没有给我想要的答案。我意识到问题太过简单,于是我重新提问,加上IPD(Integrated Product Development集成产品完整表达,它才给我过滤掉那些和我意图不一样的内容。

  缺点则是:一,无法给出直接答案,我一个个筛选信息源,点击查看;二,有些信息源不准确,这可能和我选择的筛选条件有关。

  Exa主要为AI系统和开发者设计,它的工作给AI提供需要的知识和数据。而Perplexity则是给普通人用的搜索引擎,提供问答式的搜索体验,所以,这两个是完全不同的产品。

  中间层,提供API服务,整合世界知识为AI系统提供数据,Perplexity是一个端到端的搜索引擎,直接给用户提供摘要。

  所以,Embedding技术,是帮助机器通过数字来理解和记住各种信息的一种方法。

  前者能把词汇、图片等变成一串数字,这样更容易让计算机学习和使用;后者更贴近用户,帮助我在网上找到你需要的信息,比如新闻、图片或视频等。

  百度智能云的一篇文档里,深入讨论了Embedding技术在推荐系统中的应用。

  我不是太懂,把它罗列出来,供你参考,相信这门技术在国内也能很快用到其他场景上。

  前一段时间有篇文章特别火,叫《中文互联网是否会消失》,抛开争议就整体而言,大家认为中文互联网内容并没有迅速消失,相反,中文内容在全球范围内的比例在增长。

  最近,一直在思考一个全新的,支持AI智能体的网络基础设施,这种网络会和我们人类用的网络不一样,因为AI智能体和人类需要的东西不同。

  二,虽然现在有了检索增强生成(Retrieval-augmented generation)技术,它帮助大型语言模型能够处理训练数据之外的信息,但这些通常都是私人或内部的信息。

  但是,建设这样的网络,面临很多技术和经济上的挑战。现有网络基础设施,主要是为了服务广告商,而不是用户,传统搜索引擎更关注广告点击和展示,这就导致了“SEO”产业兴起。

  AI用的搜索引擎不应该显示广告,应该直接显示结果,不幸的是,现在人类和AI使用的是同样的搜索结果,这种“一刀切”的方式很糟糕。

  它获取并索引网络上的最新内容,并通过一种独特的“链接预测”模型,通过搜索API,把数据提供给基于大型语言模型的应用程序;这个模型被专门调整,以便更好地理解搜索查询并从索引中返回相关链接。

  当你向图书管理员询问关于某个主题的书时,他不仅迅速找到了与这个主题相关的书,还确保书正是你现在最需要的那一本。

  是不是很有趣?简单讲:它想给AI搜索引擎“洗个脑”,做中间部分,左手深度检索信源后,右手投喂给大语言模型,让它更聪明、更高效。

  很快了,值得期待。最起码,这两位年轻人的创新想法,让人们看到了新的机会点。

  论文 Figure 不堪入目,句子啰嗦读不通……这几个在线科研工具可以免费用了

  斯诺克最新战报!91-11,6连鞭,小特8-1,火箭惨败,2纪录终结?

  畅销书《复利思维》作者;精神生活与商业探索,关注科技人文、消费电商、品牌营销、商业认知思维等方面。

  雷神“DQ27F240E”26.5 英寸显示器开售:2K 240Hz OLED,3989 元

在线咨询

点击这里给我发消息QQ客服

在线咨询

免费通话

24h咨询:025-52253067


如您有问题,可以咨询我们的24H咨询电话!

免费通话

微信扫一扫

微信联系
返回顶部