You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

50 lines
1.4 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# Stark FPGA
基于向量数据库与ollama的自然语言转换指令集的方案示例
## 流程
![](./docs/flow.png)
整个流程非常简单也没有复杂的地方相信关注GPT领域的都会看到过如上的流程。
具体步骤:
- 将基础指令数据集,转为向量存储到向量数据
- 当用户输入查询的问题时把问题转为向量然后从向量数据库中查询相近的答案topK
- topK概率大于阈值走词向量数据库小于等于阈值走大模型对话
- 走词向量数据库将topK进行去重合并生成指令集
- 走大模型对话,直接输出对话
## 使用范围
请参考 Ollama 的使用政策
## 关于Qdrant向量数据库
你可以查看Qdrant的官方文档https://qdrant.tech/documentation/
使用docker启动Qdrant
`docker run -p 6333:6333
-v D:\qdrant_storage:/qdrant/storage
qdrant/qdrant
`
## 具体操作流程
### Ollama查找中文词嵌入模型qwen2并进行安装ollama pull qwen2:1.5b
### 安装依赖
`pip install -r requirements.txt`
**如果安装不成功,可以使用豆瓣镜像加速**
`python -m pip install -r requirements.txt -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com`
### 数据集入库[importData.py]
`python src/import_data.py`
### 启动查询服务[server.py]
`python src/server.py`
**后台持久化运行**
`nohup python src/server.py > output.log 2>&1 &`