阿里云/计算巢服务/Hologres+PAI 5分钟一键部署企业级问答知识库
图片

Hologres+PAI 5分钟一键部署企业级问答知识库

5分钟基于Hologres向量计算+PAI部署大模型(通义/Llama2/ChatGLM)企业级问答知识库。通过模型在线服务PAI-EAS完成大模型部署,通过实时数仓Hologres存储知识向量数据并进行提示词微调,通过LangChain串联知识库流程,直接进行对话问答。
阿里云计算有限公司
阿里云计算有限公司

      Hologres+PAI一键部署企业级问答知识库

      背景信息

      Hologres是阿里巴巴自研一站式实时数仓产品,不仅支持海量数据多维分析(OLAP)、高并发低延迟的在线数据服务(Serving),还与达摩院自研高性能向量计算软件库Proxima深度整合,支持高性能、低延时、简单易用的向量计算能力。详情请参见Proxima向量计算。 PAI-EAS是阿里云的模型在线服务平台,支持用户将模型一键部署为在线推理服务或AI-Web应用,可以一键部署LLM推理、AIGC等热门服务应用。PAI-EAS 适用于实时推理、近实时异步推理等多种AI推理场景,具备Serverless自动扩缩容和完整运维监控体系能力。 LangChain是一个开源框架,可以将大模型、向量数据库、定制语料结合,高效完成专属问答知识库的搭建。Hologres现已被LangChain作为向量数据库集成,详情请参见LangChain-Hologres。 计算巢服务是一个开放给服务商和用户的服务管理PaaS平台,为服务商和用户提供了高效、便捷、安全的服务使用体验,服务商能更好地在阿里云上部署、交付和管理服务,用户能集中管理在阿里云上订阅的各类服务商提供的服务。通过计算巢,可以一键完成问答知识库所需的硬件资源拉起与软件资源部署。

      前提条件

      如果您使用RAM用户进行知识库搭建,需要通过主账号授予相应资源权限,需要的权限及授权方式请参见为RAM用户(子账号)授权

      创建服务实例

      1. 点击创建Hologres+PAI 5分钟一键部署企业级问答知识库服务实例。

      2. 创建服务实例页,配置以下字段

        模块 参数 说明
        服务实例名称 计算巢服务实例名称
        地域 Hologres、PAI-EAS、ECS实例所在地域
        付费类型配置 付费类型 ECS和Hologres的计费方式,支持按量付费或包年包月PAI-EAS实例只支持按量付费
        ECS实例配置 实例类型 ECS实例规格
        实例密码 ECS实例登录密码
        Hologres实例配置 实例规格 Hologres计算资源规格Hologres存储资源默认为按量付费,推荐您根据业务数据量,购买合适的存储抵扣包
        PAI-EAS模型配置 选择大模型 您希望部署的LLM大模型
        PAI实例规格 PAI-EAS实例规格
        VPC配置 交换机可用区 交换机所在可用区
        是否新建VPC
        专有网络 专有网络VPC实例ID或专有网络IPv4网段
        交换机 交换机实例ID或交换机子网网段
        标签和资源组 标签 服务实例需要绑定的标签
        资源组 服务实例所属的资源组
      3. 点击下一步:确认订单

      4. 查看订单页,确保依赖检查全部正常,点击立即创建
      5. 创建“Hologres+PAI一键部署企业级问答知识库”服务实例需耗时5-10分钟,您可以在服务实例管理中查看实例情况

      知识库使用

      1. 进入计算巢服务实例管理页,点击已部署的服务实例ID,进入服务实例详情
      2. 点击实例信息中的Endpoint链接,进入Hologres+大模型WebUI

      3. 在WebUI的设置页配置以下信息

        1. Embedding模型:默认选择text2vec-base-chinese模型
        2. PAI-EAS连接信息:已默认填写计算巢部署的PAI-EAS模型的VPC连接信息
        3. Hologres连接信息:
          1. 已默认填写计算巢部署的Hologres实例的VPC Host、Port、Database(chatbot)
          2. 需要您在User和Password中填入您的阿里云AccessKey ID和AccessKey Secret,可以在阿里云官网Access Key管理 查看。您也可以在Hologres中创建其他账号用于知识库搭建,详情请参见Hologres权限模型概述
          3. 点击连接Hologres,收到“连接 Hologres 成功”提示,即说明连接成功
      4. 在WebUI的上传

        1. 上传您的专属语料数据。后台会对您的语料数据进行向量化处理并导入Hologres
        2. 收到“成功上传 x 个文件”提示,即说明数据处理完成
        3. 您可以在Hologres实例chatbot数据库下的langchain_demo表中查询您的语料数据
      5. 在WebUI的聊天

        1. 选择聊天模式:
        2. 向量数据库:对您的提问,仅使用Hologres进行向量近似查询,返回top K结果
        3. 大语言模型:对您的提问,仅使用大模型直接进行回答
        4. 向量数据库+大语言模型:对您的提问,使用您已在Hologres中存储的语料数据进行向量近似查询,将结果对大模型进行提示词微调,最终使用大模型推理求解进行回答
      6. 选择最相关的k条语料:默认为3条
      7. 选择prompt模版:建议选择通用模版,您也可以自定义prompt模版
      8. 在提问框中输入您的问题,点击提交进行问答

      至此,您已完成企业级问答知识库的调试。 您可以进一步使用PAI-EAS部署的大模型的调用信息(在PAI控制台-EAS实例详情页中查看),将知识库接入实际业务场景进行使用,如接入钉钉聊天群聊(参见使用Hologres和大模型免费定制专属聊天机器人)等。

      © 2009-2022 Aliyun.com 版权所有