分享
工具:我做了一个 AI 搜索引擎
输入“/”快速插入内容
工具:我做了一个 AI 搜索引擎
用户6750
用户6750
用户8537
用户8537
2024年6月26日修改
🏝️
原创
idoubi 艾逗笔
2024-06-25 17:58
广东
原文地址:
https://mp.weixin.qq.com/s/25eXZi1QgGYIPpXeDzkQrg
前言
这是一篇两个月前就应该写的文章。
今年 3 月,我做了一个 AI 搜索引擎,名字叫做 ThinkAny,经过三个月的发展,ThinkAny 已经成长为一个月访问量 60 万的全球化产品,用户覆盖日本 / 埃及 / 俄罗斯 / 巴基斯坦等国家和地区,累计用户数突破 17 万。
我有一个习惯,每做一个新项目,都会写一篇文章进行总结。
ThinkAny 的总结文章一直拖着没写,主要原因是我有很严重的强迫症。我总觉得 ThinkAny 现在做的还不够好,想着把交互体验优化的好一些,把搜索准确度再提升一个量级之后,再来写总结文章。
然而 AI 搜索引擎这类产品,复杂性和工作量都超过了我的预期,这会是一个持久战,后面还需要投入很多的时间和精力去把产品做的更完善。
最近看了很多第三方介绍 ThinkAny 的文章和视频,总觉得没有完全表达我想表达的东西。
于是想自己写一篇文章,系统的介绍一下 ThinkAny 这款产品,以及我对 AI 搜索这个市场的一些看法。
第一部分:ThinkAny 的发展历程
介绍一下 ThinkAny
ThinkAny 是一款新时代的 AI 搜索引擎,利用 RAG(Retrieval-Augmented Generation)技术快速检索和聚合网络上的优质内容,并结合 AI 的智能回答功能,高效地回答用户的问题。
ThinkAny 的目标是:搜得更快,答得更准。
ThinkAny 的定位是做全球化市场,从第一个版本开始就支持了多语言,包括(英语 / 中文 / 韩语 / 日语 / 法语 / 德语 / 俄语 / 阿拉伯语)。
ThinkAny 的官网地址是:
https://thinkany.ai
采用双栏式布局,界面非常简洁大气。
20240619140701
我为什么要做 AI 搜索引擎
我选择做什么产品,一般有三个原则:
1.
是我很感兴趣的方向
2.
产品有价值,能带来成就感
3.
在我的能力范围内
早在去年 11 月,就有朋友建议我研究一下 AI 搜索赛道的产品。
当时我的第一想法是,搜索引擎应该是一类有很高技术壁垒的产品,不在我的能力范围,所以一直不敢尝试,也没花时间去研究。
直到今年年初,有媒体报道:“贾扬清 500 行代码写了一个 AI 搜索引擎”,当时觉得很神奇,写一个 AI 搜索引擎这么简单吗?
花了点时间研究了一下贾扬清老师开源的
Lepton Search
源码,Python 写的,后台逻辑 400 多行。
又看了一个叫
float32
的 AI 搜索引擎源码,Go 写的,核心逻辑也就几百行。
看完两个项目代码之后,开始“技术祛魅”,号称能颠覆谷歌 / 百度统治的新一代 AI 搜索引擎,好像也“不过如此”。
底层技术概括起来就一个词,叫做“RAG”,也就是所谓的“检索增强生成”。
1.
检索(Retrieve):拿用户 query 调搜索引擎 API,拿到搜素
()
结果;
2.
增强(Augmented):设置提示词,把检索结果作为挂载上下文;
3.
生成(Generation):大模型回答问题,标注引用来源;