项目概述
项目背景
客户希望打造一款数字人视频生成工具,用户上传一张照片和一段脚本文字,系统自动合成对口型的数字人视频,支持 MiniMax TTS 和自定义声音克隆,输出 720P/1080P 短视频(约1分钟)。
核心价值
让中小商家、个人 IP、主播能低成本、快速生成数字人短视频内容,无需专业设备和拍摄,降低内容生产门槛,快速赋能短视频营销场景。
交付物清单
iOS App
IPA 安装包 / TestFlight 内测分发
Android App
APK 安装包 / 直装分发
AI 推理服务
Infinite Talk + MiniMax TTS 接口服务
API 后端
任务队列、视频状态管理、文件存储
数据库设计
用户、作品、任务记录完整数据方案
部署配置
服务器部署文档 + 运维手册
需求范围
+ 包含在内(In Scope)
- Flutter 跨平台 App(iOS + Android)
- 图片上传(相册选择)
- 脚本输入(文字编辑)
- Infinite Talk 对口型 API 对接
- MiniMax TTS 文字转语音集成
- MiniMax 声音克隆接口对接
- 视频异步生成 + 进度推送
- 视频预览 + 本地下载保存
- 用户注册 / 登录(手机号或一键)
- 历史作品列表
- 服务器端 API + 数据库
- GPU 推理服务部署配置
- 不包含(Out of Scope)
- 微信/抖音等第三方平台分享 SDK
- 视频剪辑(剪切/字幕/配乐/转场)
- 数字人模板市场(预设形象库)
- 视频编辑预览器(加字幕/配乐)
- 多语言翻译功能
- 私有化声音克隆模型训练
- App Store / 应用宝上架代提交
- 管理后台完整版(可用数据库直查代替)
- CDN 加速配置(可选后续添加)
关键假设
- Infinite Talk 和 MiniMax 均采用官方 API,不私有化部署模型(节省大量成本)
- 声音克隆由 MiniMax 云端 API 实现,无需定制训练声音模型
- 服务器选用 GPU 云服务器(如阿里云 GN6v 或 AWS G4),按月付费
- App UI 采用现有 Flutter 组件库,无需从零设计品牌视觉
- 客户自行准备 Apple Developer 账号($99/年)用于 iOS 内测分发
工作量明细
| 模块 | 功能点 | PM | UI | AI/后端 | Flutter | QA | 小计 |
|---|---|---|---|---|---|---|---|
| AI 推理服务 | Infinite Talk API 对接(图片+音频 对口型视频) | - | - | 2 | - | - | 2天 |
| AI 推理服务 | MiniMax TTS API 集成(文字 语音) | - | - | 1 | - | - | 1天 |
| AI 推理服务 | MiniMax 声音克隆 API 集成 | - | - | 2 | - | - | 2天 |
| 后端服务 | API 框架搭建(FastAPI/Flask)+ 数据库设计 | - | - | 2 | - | - | 2天 |
| 后端服务 | 任务队列 + 异步视频处理流程 | - | - | 3 | - | - | 3天 |
| 后端服务 | 文件存储(OSS/S3)+ 视频输出 | - | - | 2 | - | - | 2天 |
| 后端服务 | WebSocket / 消息推送(进度通知) | - | - | 1 | - | - | 1天 |
| Flutter App | 项目初始化 + 架构设计(Clean Architecture) | 0.5 | - | - | 1.5 | - | 2天 |
| Flutter App | 登录注册(手机号 / 一键 Google 登录) | - | 1 | - | 1.5 | - | 2.5天 |
| Flutter App | 图片选择器(相册)+ 脚本编辑器 | - | 1 | - | 2 | - | 3天 |
| Flutter App | 视频生成任务提交 + 进度条展示 | - | 1 | - | 2 | - | 3天 |
| Flutter App | 视频预览播放器 + 下载保存到相册 | - | 1 | - | 2 | - | 3天 |
| Flutter App | 历史作品列表 + 删除管理 | - | 1 | - | 1.5 | - | 2.5天 |
| 产品 / 管理 | 需求文档、流程图、验收标准 | 2 | - | - | - | - | 2天 |
| 产品 / 管理 | 项目协调、需求答疑、上线保障 | 2 | - | - | - | - | 2天 |
| UI 设计 | App 整体 UI 设计(6-8个核心页面) | - | 2 | - | - | - | 2天 |
| UI 设计 | UI 标注、切图输出、设计走查 | - | 1 | - | - | - | 1天 |
| 测试 | 功能测试用例 + 回归测试 | - | - | - | - | 2 | 2天 |
| 测试 | 双端(iOS + Android)兼容性验证 | - | - | - | - | 2 | 2天 |
| 合计人天 | 4.5天 | 7天 | 13天 | 10.5天 | 4天 | 39天 | |
注:各角色并行工作,总日历周期 5-6 周(团队 4 人:PM 0.5人 + AI后端 1人 + Flutter 1人 + UI 0.5人 + QA 0.5人,实际按人员配比拉齐)。
报价汇总
费用构成
PM(4.5天 x ¥2,500)¥11,250
UI 设计(7天 x ¥2,500)¥17,500
AI/后端开发(13天 x ¥3,000)¥39,000
Flutter 开发(10.5天 x ¥3,000)¥31,500
测试 QA(4天 x ¥2,000)¥8,000
第三方 AI API(估算 2 个月)¥3,000
项目总价(含税)
¥110,250
报价有效期 30 天;如纯开发交付(不含第三方 API 费用),为 ¥107,250
项目里程碑
Phase 1 / 需求 & 设计
第 1-2 周
需求确认 / UI 设计稿交付 / API 接口定义 / 数据库设计
Phase 2 / AI + 后端开发
第 2-4 周
Infinite Talk / MiniMax API 集成 / 推理服务上线 / 后端 API 开发 / 任务队列部署
Phase 3 / Flutter App 开发
第 3-5 周
核心功能开发(图片上传、脚本输入、视频生成) / 进度推送 / 视频预览 / 历史作品列表
Phase 4 / 测试 & 上线
第 5-6 周
双端功能测试 / 兼容性验证 / 修复 / 交付 TestFlight / APK 安装包
付款方式
1
合同签订
合同签署后 5 个工作日
40% (¥44,100)
2
开发完成
App 开发完成 + 后端部署
40% (¥44,100)
3
验收交付
双端安装包验收通过
20% (¥22,050)
附加说明
报价说明与免责条款
- 本报价基于现有需求文档,需求变更(增减功能、调整范围)需重新评估工时和费用;
- 第三方 AI API 费用(Infinite Talk / MiniMax)按实际用量收取,不在此报价范围内,预计 ¥500-1,500/月(初期);
- 服务器费用(GPU 云服务器约 ¥2,000-4,000/月)由客户另行承担,不含在本报价内;
- App Store 上架需客户自行注册 Apple Developer 账号($99/年),我方可提供技术指导;
- 本报价含 6% 增值税专用发票;
- 如客户要求保密协议(NDA),可在合同中另行约定。