How it works

三类建模素材，一个数字人格

素材越丰富，复刻越精准。每一类数据各自塑造智能体的不同维度。

01 / 聊天文本

Chat transcripts

导出微信或 QQ 聊天记录为 TXT/CSV。建议至少 5,000 条消息，数据量越大措辞贴合度越高。

今天天气真好

是啊，出去走走？

去哪呢

02 / 人物特质

Personality profile

性格特点、口头禅、说话习惯。若无整理好的资料，我们可从原始素材中统一提取与归纳。

性格标签

幽默 · 温和 · 理性

03 / 音视频素材

Audio & video

语气语调决定对话真实感。不少于 30 分钟 MP3/WAV/MP4 素材，实现高保真语音克隆。

Process

从素材到上线对话

标准化四步流程，将原始素材转化为可部署的 AI 对话智能体。

素材清洗

解析聊天记录、降噪音频、标注情绪标签

模型微调

基于开源 LLM 进行 LoRA 微调，注入人格特征

语音克隆

TTS/VC 技术复刻音色语调，支持多情绪

平台部署

对接微信/QQ 协议，一键上线

Platforms

训练完成，即连即用

无需额外适配，智能体直接部署到对话所在的平台。

微信 WeChat

个人号 / 公众号双模式接入，支持文字与语音消息实时回复。

文字消息语音消息公众号个人号

QQ

原生协议集成，稳定在线不掉线，支持群聊与私聊场景。

私聊群聊表情包语音

Tech Stack

开源开放，技术驱动

LLM 微调

LoRA / QLoRA

语音克隆

GPT-SoVITS

对话引擎

LangChain

平台协议

微信 / QQ API

容器部署

Docker

向量记忆

ChromaDB

FAQ

常见问题

需要多少聊天记录才够？

建议至少 5,000 条。超过 2 万条效果更佳。如不足可结合人物特质描述增强训练。

训练一个智能体需要多长时间？

素材齐全情况下文本模型 1-2 天交付初版；含语音克隆的全模态约 3-5 天。

微信 / QQ 接入是否合规？

使用官方开放协议接入，建议使用专用账号部署。具体合规细节可咨询获取最新方案。

语音克隆需要什么格式？

MP3、WAV、MP4 均可。安静环境录制，不少于 30 分钟，涵盖不同情绪状态为佳。

我的数据安全吗？

所有素材仅用于训练你的专属模型。完成后可选择自行持有模型权重，我们不留存原始数据。