软件测试小侦探

2024-08-12 11:33 University of California Berkeley 测试开发发布于江西

关注

打造垂直领域内容的问答机器人

简介

在大模型问世之后，其中一个最核心的功能就是问答机器人。但是若直接将问题抛给 ChatGPT，仍然解决不了以下限制：

相关的关联数据需要联网。
相关的关联数据是 GPT 也不知道的私密数据。

而在前面介绍RAG 检索增强生成的时候也同样提到了这一点。

应用场景

垂直领域内容的问答机器人的应用场景非常多，比如金融、医疗、电商等。

如果是针对于互联网相关的从业人员，比如开发、测试、产品等，我们还可以让其帮助我们进行以下多种类型的工作：

公司知识库检索。
需求分析。
用例评审、测试用例生成
代码生成。

实践演练

那么如果要完成一个垂直领域内容的问答机器人，其实也是有多种方式的：

openai 官方在 2023 年末做了一次重大更新，推出了官方的 assistant，可以通过官方的 assistant 完成一个问答机器人。
其他方式，比如通过 RAG 结合向量数据库，或结合 LangChain 等人工智能应用框架完成。

使用官方的 assistant

点击查看官方 assistant 使用教程

如果使用 assistant 创建一个垂直领域内容的问答机器人，那么主要需要的，就是 Retrieval 的能力，注意这个能力至少需要 gpt-3.5-turbo-1106（支持较新版本）或 gpt-4-turbo-preview 型号。

编写好 Instructions，注意角色设定越详细越清楚越好。
将 Retrieval 的配置打开，再将需要给机器人检索的文件上传上去（注意，文件越大 token 消费越高）。
输入想要检索的信息的 prompt。
即可获取到文档内的信息内容。
注意，上传的文件有格式限制，支持的格式为官方支持的格式

通过编写代码实现


import time
from openai import OpenAI
import os
client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY"))
# 1. 绑定课程文件
file = client.files.create(
    file=open("课程数据.md", "rb"),
    purpose='assistants'
)
# 2. 创建课程处理机器人
assistant = client.beta.assistants.create(
    instructions="你是一个课程维护者，你需要清楚的知道课程名称以及其对应的url地址。",
    model="gpt-4-turbo-preview",
    tools=[{"type": "retrieval"}],
    file_ids=[file.id]
)
# 3. 创建一个线程
thread = client.beta.threads.create()
# 4. 创建一条消息
message = client.beta.threads.messages.create(
    thread_id=thread.id,
    role="user",
    content="请告诉我超时处理对应的视频地址"
)
# 5. 提问
run = client.beta.threads.runs.create(
    thread_id=thread.id,
    assistant_id=assistant.id,
    instructions="你是一个课程维护者，你需要清楚的知道课程名称以及其对应的url地址。",
)
# 6. 循环查询问题是否已经解决完成
def wait_on_run(run, thread):
    while run.status == "queued" or run.status == "in_progress":
        run = client.beta.threads.runs.retrieve(
            thread_id=thread.id,
            run_id=run.id,
        )
        time.sleep(0.5)
    return run
wait_on_run(run, thread)
# 6. 获取历史消息
messages = client.beta.threads.messages.list(thread_id=thread.id).model_dump_json(indent=2)
print(messages)

其他方式

结合向量数据库完成。
结合 LangChain 等人工智能应用框架完成。

总结

垂直领域内容的问答机器人的产品需求。
垂直领域内容的问答机器人的实现方案。
使用官方 assistant 实现垂直领域的问答机器人。

全部评论

推荐最新楼层

04-26 21:51

杭州电子科技大学大数据开发工程师

别做那些AI套壳项目。

什么叫套壳？就是调个OpenAI接口，套个对话框，起个名字叫XX智能助手。这种项目满大街都是，面试官一眼就看穿，甚至会直接问 你这个跟直接用ChatGPT有什么区别？你答不上来，就凉了。真正值得做的项目有个共同特点：解决了一个具体的真实问题。比如给自己的笔记库做一个RAG检索系统，比用Notion搜索准多了；比如做一个自动分析竞品评论的Agent，每天抓数据总结痛点；比如给代码库做一个本地部署的问答机器人，不用担心数据泄露。这些项目的共同逻辑是：有真实场景、有技术选型、有踩过的坑。面试官问起来你能说清楚为什么这么做、遇到了什么问题、怎么解决的。这才是项目的价值，不是功能有多炫。做一个跑通的真实...

哪些AI项目值得做？

点赞评论收藏

分享

04-24 14:11

已编辑

门头沟学院算法工程师

Agent 开发面经总结【04/24】阿里巴巴 / 蚂蚁 / 字节跳动总结

最近按当前筛选整理了一波面经，这次挑了 8 篇相对值得复盘的内容，方便刷题和回看。1. 蚂蚁｜暑期实习｜未知日期：2026-04-24关键词：Agent面经难度：4 星标签：技术面技术栈：Java、Spring Boot、AOP、JDK 8、G1、ZGC、MySQL、Redis面经总结本场面试以 Java 后端基础、数据库与网络场景题、AI Agent 项目深挖及 AI Coding 认知为核心。高频问题【并发与多线程】线程池的核心构造参数有哪些？【并发与多线程】一个有队列的线程池，请求不断进来，说说线程池内部的执行逻辑？【编程语言特性】平时用什么 JDK 版本？【操作系统】JDK 8 的垃圾...

面试问题记录

点赞评论收藏

分享

04-01 09:22

门头沟学院 Java

大家可以帮看下问题吗，就想找一个日常实习，一个面都没有，是不是项目太简单了

简历中的项目经历要怎么写

点赞评论收藏

分享

04-03 11:06

门头沟学院测试工程师

26届软测求锐评简历

投了一个月了没约到面试

最后一个本科生：进厂吧

点赞评论收藏

分享

04-26 17:33

北京大学人力资源总监

AI+CFD，避坑公司笔记，初版

与其说是避坑笔记，不如说是一个系列的开篇，后续更新跟进信息会放在评论区，最近关注到AI+CFD/CAE方向的活跃程度，也觉得是一个AI渗透的重要指标，校招或者比较关注发展性的求职者，可以把该方向作为一个重点关注方向，AI进入游戏、金融和互联网都还算是圈禁在虚拟世界，一旦在CFD方向有很大的进步，相信制造业企业都会跟进，相比传统的视觉找缺陷做诊断，个人认为这个方向在重新定义机械和结构岗位的工作内容，个人非理工专业，表述不准的地方希望指正。1、主要分三类，跨行大厂，工具大厂和初创公司，根据主攻行业来看，绝多数都会集中在空/天/船、气动和热管理方向，材料研发和分子动力等关注较少；2、多数AI+CFD...

点赞评论收藏

分享

评论

1

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如果春招能重来，我会___ #

3780次浏览 40人参与

# 想做Agent可以做哪些岗位？ #

1871次浏览 23人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

42404次浏览 496人参与

# 这个offer值得去吗？ #

1526次浏览 22人参与

# 面试官拷打AI项目都会问什么？ #

1547次浏览 80人参与

# 除了线上，还能去哪些地方投简历 #

2838次浏览 30人参与

# 你觉得最好用的AI编程工具是_ #

756次浏览 23人参与

# mt对你说过最有启发的一句话 #

115039次浏览 870人参与

# 你会因为行情，降低找工作标准吗？ #

6921次浏览 77人参与

# 如何排解工作中的焦虑 #

324681次浏览 2791人参与

# 工作两年想退休了 #

272179次浏览 2057人参与

# 银行笔面经互助 #

195701次浏览 1324人参与

# 双非本科的出路是什么？ #

230648次浏览 1657人参与

# 你的第一家实习公司是什么档次？ #

73317次浏览 342人参与

# 你和你的mentor相处模式是__ #

5408次浏览 43人参与

# 你的mentor是什么样的人？ #

61519次浏览 795人参与

# 科大讯飞求职进展汇总 #

384193次浏览 3069人参与

# 实习第一天，你在干什么 #

3338次浏览 23人参与

# 哪些公司在招寒假实习？ #

95370次浏览 768人参与

# 秋招投递记录 #

416970次浏览 3283人参与

# 如果公司降薪，你会跳槽吗？ #

160827次浏览 950人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务