# Stark FPGA 基于向量数据库与ollama的自然语言转换指令集的方案示例 ## 流程 ![](./docs/flow.png) 整个流程非常简单,也没有复杂的地方,相信关注GPT领域的都会看到过如上的流程。 具体步骤: - 将基础指令数据集,转为向量存储到向量数据 - 当用户输入查询的问题时,把问题转为向量,然后从向量数据库中查询相近的答案topK - topK概率大于阈值走词向量数据库,小于等于阈值走大模型对话 - 走词向量数据库,将topK进行去重合并,生成指令集 - 走大模型对话,直接输出对话 ## 使用范围 请参考 Ollama 的使用政策 ## 关于Qdrant向量数据库 你可以查看Qdrant的官方文档:https://qdrant.tech/documentation/ 使用docker启动Qdrant `docker run -p 6333:6333 -v D:\qdrant_storage:/qdrant/storage qdrant/qdrant ` ## 具体操作流程 ### Ollama查找中文词嵌入模型qwen2,并进行安装:ollama pull qwen2:1.5b ### 安装依赖 `pip install -r requirements.txt` **如果安装不成功,可以使用豆瓣镜像加速** `python -m pip install -r requirements.txt -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com` ### 数据集入库[importData.py] `python src/import_data.py` ### 启动查询服务[server.py] `python src/server.py` **后台持久化运行** `nohup python src/server.py > output.log 2>&1 &`