对话谷歌首席技术官肖恩,搜索引擎的里程碑,来看看搜索引擎界的大哥Algolia的“快、准、狠”突围关键

原创 | 文 BFT机器人 

图片

人物背景

Character Background

Sean Mullaney是Algolia(端到端人工智能搜索和发现平台)的首席技术官,也是前 Stripe和谷歌高管,拥有扩展工程组织、开发人工智能驱动的搜索和发现工具以及在全球范围内发展API优先解决方案的背景。

在Algolia,他负责监督仅次于谷歌的第二大搜索引擎背后的技术,该引擎每年的搜索量超过1.5万亿次。最近,他领导公司推出了AlgoliaNuralSearc一一世界上最快的、超可扩展且经济高效的矢量和关键字搜索API。

图片

兴趣萌芽

Budding Interests

采访者:计算机科学最初吸引你的地方是什么?

Sean Mullaney:我10岁的时候,父母给家里买了第一台电脑。我想做的第一件事就是弄清楚如何编写一款我从书上抄下来的文字冒险游戏。几年后,我开始学习 c++,但作为一个刚刚开始探索计算机科学的青少年,对于设计和制作电脑游戏的兴趣还是比较大。

经验历程

Experience History

采访者:你在谷歌工作了7年多,在那里你帮助建立并领导了战略、运营、大数据和机器学习方面的团队。你最喜欢的项目是什么?你从这个经历中学到了什么?

Sean Mullaney我们弄清楚了如何利用我们拥有的关于广告商如何使用我们的产品来帮助销售团队的大数据。我们编写开发的自定义规则(后来更复杂的神经网络)来预测应该在什么时闻用什么产品接触哪些客户,从而最大限度地提高销售人员的时间并带来可观的收入。谷歌上有超过100万的广告商,这个工具极大地帮助销售团队在大海捞针。

Algolia的存在价值

Algolia Existence Value

采访者:在最近的DevBit总结中,你描述了Algolia的目的是让用户能够索引世界并将内容运转起来,能详细解释一下这句话是什么意思吗?

Sean Mullaney:最终,我们希望帮助我们的客户从他们的数据中获得价值。互联网创造了大量的内容和电子商务产品,虽然这一发展是一个重要的里程碑,但现在大量的信息意味着,作为用户,找到你真正想要的东西比以往任何时候都要困难。然而,当搜索和发现由人工智能驱动时,可以智能地访问不断增长的内容列表,并将其付诸行动,真正帮助用户,而不仅仅是压倒他们。

NeuralSearch技术介绍

Technical Introduction

采访者:2022年9月,Search.io及其专有旗舰产品NeuralSearch™被Algolia收购,您能讨论一下这项搜索技术具体是什么吗?

Sean Mullaney简而言之,Algolia NeuralSearch将关键字匹配与基于向量的自然语言处理集成在一个API中,这是业界首创。该解决方案结合了我们专有的首创神经散列技术,使矢量的使用可扩展,并且使用成本效益提高90%——这是其他人工智能公司(包括 ChatGPT)面临的问题。这款突破性产品真正令人兴奋的是,它使真正的人工智能搜索可扩展到企业级组织。

新技术还允许零售商等客户理解并提供与查询相匹配的内容,这些查询通常过于会话化,无法提供准确或任何结果(被认为是长尾)。这些内容占当前网站搜索量的55%。作为唯一一个将人工智能应用于查询理解、检索和排名的端到端人工智能搜索解决方案,,NeuralSearch真正理解这些查询,并将错失的机会转化为收入。

采访者:除了Neuralsearch™之外,还使用了哪些其他机器学习方法?

我们将人工智能整合到三个主要功能中一一查询理解、查询检索和结果排序。我们在Algolia称之为人工智能搜索三明治:

查询理解Alqolia的高级自然语言理解(NLU)和AI驱动的矢量搜索提供自由形式的自然语言表达理解和AI驱动的查询分类,可准备和构建用于分析的查询。此外,基于用户反馈的自适应学习可以对意图理解进行微调。

检索然后检索最相关的结果,并从最相关到最不相关进行排序。检索过程使用相同的索引将神经散列结果与关键字进行合并,以方便检索和排序。这种方法解决了“空结果”问题,并显著提高了点击位置和点击率。在搜索和发现领域中没有其他搜索平台能够提供这种强大的功能。

排名最后,Algolia的人工智能重新排名将最好的结果推到顶部,该排名考虑了搜索查询附带的许多信号(包括精确的关键字匹配分数、上下文个性化配置文件、观察到的受欢迎程度、项目的数量、语义匹配分数等)并学习达到最大的相关性。

此外,随着索引的变化、新产品的添加、新内容的上传,或者术语的新含义,人工智能驱动的AlgoliaNeuralSearch产品将自动学习和调整。它不需要任何额外的人员统计或人工操作,它会根据查询或搜索短语自动匹配关键字或概念(可能是两者的混合)。这使搜索处于自动驾驶状态。

Algoia的成功关键

keys To Success

采访者:Algolia最近将其免费计划从提供1万条记录增加到100条记录,这背后的想法是什么,市场反应如何?

Sean Mullaney:我们选择通过引入两个新的面向开发人员的计划来改进Algolia的定价和包装,使其更加适合开发人员:一个是免费的“构建”计划,一个是以实惠的价格提供轻松可扩展性的“增长”计划。

新的Build计划将开发人员可以在Algoli中存储的免费记录数量从1玩条增加到现在的 100万条记录。这意味着开发人员现在可以在Algolia中建立索引的免费记录数量增加了 100倍。此外,Algolia将其Grow计划中的搜索请求成本削减了50%,将记录成本削减了60%。

我们更新的“构建”定价计划背后的想法是让开发者免费访问其人工智能搜索和发现平台的全部功能。当开发人员准备扩展其应用程序时,“增长”计划使开发人员能够为实时生产设置提供更适合开发人员的基于使用的定价。

这里需要注意的一点是,任何设计师、创建者或构建者(无论他们是临时的还是完全投入的软件工程师)都可以快速轻松地访问需要的所有工具、文档、示例代码、教育内容和跨平台集成功能,以便开始管理他们的数据、构建搜索前端、配置分析等等(所有这些都是免费的)。此外,他们还可以立即访问拥有500多万构建者组成的不断增长的开发人员社区。

个性化神器

CORPORATE CULTURE

采访者:你能讨论一下他们提供的搜索个性化工具吗?

Sean Mullaney:Algolia为公司提供了多种搜索个性化工具,帮助他们利用数据更好地改进推荐,包括不同类型的推荐和利用数据实际驱动这些推荐的独特方法。

其中的几个例子包括:

趋势:建议其他流行趋势并与客户进行的搜索相关的项目。

基于评级:人们想希望购买评分最高的产品。

个性化:根据您上次购买的产品、浏览历史、位置或其他因素,我们推荐这些产品。

这些数据驱动的方法可以根据客户与产品的互动方式,帮助快速增强和改善结果,所以更有可能推荐那些真正转化最好的产品。

神经散列的神辅助

Divine Assistance

采访者:你将Algolia描述为世界上最具扩展性的混合人工智能搜索引擎。Algolia是如何设计得如此高效的?

Sean Mullaney:这一切都回到了神经散列。这和尖端的解决方案可以压缩并显著加快了每个查询的速度。计算散列相似度比计算标准向量相似度要快得多,并且可以在几号秒内返回结果。

神经散列代表了将人工智能检索应用于各种各样的生产中,结合人工智能查询处理和重新排名,有望释放人工智能现场搜索的全部力量。在Algolia取得专有突破之前,基于矢量的搜索计算成本太高,无法在生产中运行。

我最想关注的部分是三明治中的肉:检索。之所以说我们是唯一真正的端到端AI搜索引警,是因为在搜索行业的幕后,一直有一场将AI添加到检索中的斗争。信息检索是一个极其复杂的过程,而大规模掌握高性能、经济高效的AI检索则更为复杂。我们通过突破性的神经散列技术掌握了它。

图片

读者感悟:

人工智能技术在随着社会的需求变化不同而不断创新,伴随着社会架构和经济的发展,极大的促进了社会的进步和经济的发展。而人工智能搜索发展至今,技术在不断成熟完善,肖恩作为人工智能搜索重要技术人员,他现如今所在的公司Algolia,还在推出新的人工智能搜索技术,实现扩展到了企业组织上这一突破,让企业发展更加高效。相信在不久的将来人工智能搜索会惠及到人类社会的方方面面。

END

作者 | 春花

排版 | 春花

审核 | 猫

若您对该文章内容有任何疑问,请于我们联系,将及时回应。如果想要了解更多的前沿资讯,记得点赞关注哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/88535.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

利用多种机器学习方法对爬取到的谷歌趋势某个关键词的每日搜索次数进行学习

大家好,我是带我去滑雪! 前一期利用python爬取了谷歌趋势某个关键词的每日搜索次数,本期利用爬取的数据进行多种机器学习方法进行学习,其中方法包括:随机森林、XGBOOST、决策树、支持向量机、神经网络、K邻近等方法&am…

leetcode 739. 每日温度

2023.8.28 本题用暴力双层for循环解会超时&#xff0c;所以使用单调栈来解决&#xff0c;本质上是用空间换时间。维护一个单调递减栈&#xff0c;存储的是数组的下标。 代码如下&#xff1a; class Solution { public:vector<int> dailyTemperatures(vector<int>&…

科技资讯|三星再申请智能戒指商标,智能穿戴进入更小型化发展

三星正在积极扩展可穿戴设备生态&#xff0c;近日向英国知识产权局提交了名为“Samsung Curio”的新商标&#xff0c;其分类为“Class 9”&#xff0c;可能会用于未来的智能戒指。 智能戒指&#xff1a; 可穿戴计算机本质上的智能手环、智能项链、智能眼镜和智能戒指&#xff1…

更新netframe报错,更新.netFrame 到4.8

背景&#xff1a; 更新了Java程序后&#xff0c;启动提示我更新netframe 手动更新.netFrame 到4.8 ndp48-x86-x64-allos-enu.exe 发现报错&#xff1a; 继续百度解决报错。方案为&#xff1a; https://blog.csdn.net/i2blue/article/details/88821583 产生阻滞的问题: 你…

职业技术培训内容介绍

泰迪职业技术培训包括&#xff1a;Python技术应用、大数据技术应用、机器学习、大数据分析 、人工智能技术应用。 职业技术培训-Python技术应用 “Python技术应用工程师”职业技术认证是由工业和信息化部教育与考试中心推出一套专业化、科学化、系统化的人才考核标准&…

软件测试的CMA和CNAS分别是什么?有什么用途和区别?

各行各业都有不同的证书&#xff0c;第三方软件检测机构也需要经过考核检验以获取认可。今天我们将围绕软件测试的CMA和CNAS展开讨论&#xff0c;以帮助您更好地了解它们的定义、区别和用途。 一、CMA软件测试&#xff1a; 1、定义&#xff1a;CMA软件测试是指基于中国计量认…

“探索Spring与MyBatis集成的最佳实践与技巧“

目录 引言&#xff1a;1.Spring与MyBatis集成的基本配置2.Spring aop集成pagehelper插件总结附带内容&#xff1a; 引言&#xff1a; 在现代的软件开发中&#xff0c;Spring和MyBatis是两个非常流行的框架。Spring提供了强大的依赖注入和面向切面编程的功能&#xff0c;而MyBa…

【LeetCode-面试经典150题-day15】

目录 104.二叉树的最大深度 100.相同的树 226.翻转二叉树 101.对称二叉树 105.从前序与中序遍历序列构造二叉树 106.从中序与后序遍历序列构造二叉树 117.填充每个节点的下一个右侧节点指针Ⅱ 104.二叉树的最大深度 题意&#xff1a; 给定一个二叉树 root &#xff0c;返回其…

最新PHP短网址生成系统/短链接生成系统/URL缩短器系统源码

全新PHP短网址系统URL缩短器平台&#xff0c;它使您可以轻松地缩短链接&#xff0c;根据受众群体的位置或平台来定位受众&#xff0c;并为缩短的链接提供分析见解。 系统使用了Laravel框架编写&#xff0c;前后台双语言使用&#xff0c;可以设置多域名&#xff0c;还可以开设套…

python的观察者模式案例

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言二、具体代码写在结尾 前言 最近写安卓的代码比较多&#xff0c;了解了java代码的注册回调机制&#xff0c;也就是观察者模式&#xff0c;搜索了一下python也有…

SQL注入之报错注入

文章目录 报错注入是什么&#xff1f;报错注入获取cms账号密码成功登录 报错注入是什么&#xff1f; 在注入点的判断过程中&#xff0c;发现数据库中SQL 语句的报错信息&#xff0c;会显示在页面中&#xff0c;因此可以利用报错信息进行注入。 报错注入的原理&#xff0c;就是在…

【实训项目】精点考研

1.设计摘要 如果说高考是一次能够改变命运的考试&#xff0c;那么考研应该是另外一次。为什么那么多人都要考研呢&#xff1f;从中国教育在线官方公布是考研动机调查来看&#xff0c;大家扎堆考研的原因大概集中在这6个方面&#xff1a;本科就业压力大&#xff0c;提升竞争力、…