How it works

三类建模素材,一个数字人格

素材越丰富,复刻越精准。每一类数据各自塑造智能体的不同维度。

01 / 聊天文本

Chat transcripts

导出微信或 QQ 聊天记录为 TXT/CSV。建议至少 5,000 条消息,数据量越大措辞贴合度越高。

今天天气真好
是啊,出去走走?
去哪呢
02 / 人物特质

Personality profile

性格特点、口头禅、说话习惯。若无整理好的资料,我们可从原始素材中统一提取与归纳。

性格标签
幽默 · 温和 · 理性
03 / 音视频素材

Audio & video

语气语调决定对话真实感。不少于 30 分钟 MP3/WAV/MP4 素材,实现高保真语音克隆。

Process

从素材到上线对话

标准化四步流程,将原始素材转化为可部署的 AI 对话智能体。

1

素材清洗

解析聊天记录、降噪音频、标注情绪标签

2

模型微调

基于开源 LLM 进行 LoRA 微调,注入人格特征

3

语音克隆

TTS/VC 技术复刻音色语调,支持多情绪

4

平台部署

对接微信/QQ 协议,一键上线

Platforms

训练完成,即连即用

无需额外适配,智能体直接部署到对话所在的平台。

微信

微信 WeChat

个人号 / 公众号双模式接入,支持文字与语音消息实时回复。

文字消息语音消息公众号个人号
QQ

QQ

原生协议集成,稳定在线不掉线,支持群聊与私聊场景。

私聊群聊表情包语音
Tech Stack

开源开放,技术驱动

LLM 微调
LoRA / QLoRA
语音克隆
GPT-SoVITS
对话引擎
LangChain
平台协议
微信 / QQ API
容器部署
Docker
向量记忆
ChromaDB
FAQ

常见问题

需要多少聊天记录才够?
建议至少 5,000 条。超过 2 万条效果更佳。如不足可结合人物特质描述增强训练。
训练一个智能体需要多长时间?
素材齐全情况下文本模型 1-2 天交付初版;含语音克隆的全模态约 3-5 天。
微信 / QQ 接入是否合规?
使用官方开放协议接入,建议使用专用账号部署。具体合规细节可咨询获取最新方案。
语音克隆需要什么格式?
MP3、WAV、MP4 均可。安静环境录制,不少于 30 分钟,涵盖不同情绪状态为佳。
我的数据安全吗?
所有素材仅用于训练你的专属模型。完成后可选择自行持有模型权重,我们不留存原始数据。