正文内容 评论(0)
七、本地AI应用2:建立本地知识库 通过AI大模型快速处理海量数据
对于最需要本地部署AI大模型的用户来说,最大的理由肯定是为了数据安全,即便是普通公司甚至个人,肯定都会有一些不方便上云的数据资料,这时候使用本地知识库来管理海量数据就是一个非常好的选择。
我们利用Ollama搭建的本地Deepseek-R1:14B大模型,就可以很方便的建立并使用本地知识库,轻松在本地管理数据,确保数据安全。
首先我们在Ollama中拉取文本嵌入模型, Deepseek等大模型是无法直接读取本地文件的,必须先使用文本嵌入模型将资料处理成大模型可读取的固定长度向量,下载文本嵌入模型自需要在Ollama运行窗口中输入:
ollama pull nomic-embed-text
也可以在图形UI中的模型管理中下载
文本嵌入模型nomic-embed-text体积只有262MB,却是建立本地知识库所必需的。
我们在Page Assist插件中,找到RAG设置,在文本嵌入模型处选择刚刚下载的nomic-embed-text,就完成了建立本地知识库的前期准备工作,除了Page Assist插件外,也有其它可以支持建立本地知识库的AI大模型工具,操作方法也都类似。
RAG(Retrieval-Augmented Generation检索增强生成) 是一种结合了信息检索和语言模型的技术。它通过从大规模的知识库中检索相关信息,并利用这些信息来指导语言模型生成更准确和深入的答案,是建立本地知识库的必要技术。
下面就可以建立本地知识库了,我们使用B站UP@行星推进器 制作并分享的镜头大全表格,收录了800余款镜头的参数信息,非常适合使用本地知识库检索信息。在Page Assist左侧找到管理知识,点击添加知识,简单命名和上传文件后,就建立了一个新的知识库。
Page Assist支持这些格式:pdf、csv、txt、md和docx,所以我们先将xlsx文件转换为csv文件。
上传文件之后文本嵌入模型就会自动会文件进行处理,需要一小段时间。
文本嵌入模型处理完毕之后,就可以开始使用知识库进行信息检索和查询了。
点击输入框中知识库的图标,就可以选择刚刚建立好的“镜头大全”知识库。
选择知识库之后,可以看到输入框中少了一些功能,上传图片和联网的标志隐藏了起来,在知识库中,是不能使用联网和识图功能的,但不影响知识库本身的功能使用。
屏幕上方可以看到“镜头大全”知识库已被读入,这时就可以使用Deepseek-R1:14B模型来检索知识库,Deepseek-R1:14B模型对用户提问和知识库内的语句理解和推理能力远超规模较小的模型。
此时向Deepseek-R1:14B模型提问,它就会用上传的资料内容进行回答,比自己翻找表格更加方便快捷。
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...