把复杂音视频 API 能力,转化为普通业务用户也能理解、能完成、愿复用的产品体验
这意味着三层转化:
| 转化层级 | 从 | 到 | 验证问题 |
|---|---|---|---|
| 能理解 | 看 API 文档 | 看界面就知道能做什么 | 用户是否能找到功能入口? |
| 能完成 | 写代码调接口 | 上传 → 配置 → 等待 → 拿结果 | 用户是否能自主完成全流程? |
| 愿复用 | 每次重新对接 | 记住体验 → 主动回来 | 用户完成后是否有正向感受? |
Tideo 是一款面向业务用户的 AI 视频译制工具,将字幕擦除、翻译、配音等复杂音视频处理能力,封装为角色化、游戏化的协作体验。用户上传视频后,由四位 AI 角色(导演·林雨晨、后期·陈默、翻译·李明远、配音·苏雅)协同完成处理,全程可见、可控、可精调。
从三个互补方向验证产品体验是否达标,形成"定量 + 定性 + 实测"的完整证据链:
基于用户行为数据的定量验证
基于产品设计理念的定性分析
基于真实用户的实测验证
指标分三层:一个核心指标定成败,体验指标找问题,技术/商业指标看全局。
| 指标 | 定义 | 目标 | 采集方式 | 设计可控性 |
|---|---|---|---|---|
| 自助任务完成率 | 用户从上传视频到获得最终成片,全程无需人工介入的任务占比 | > 80% | 任务状态埋点 | ✦ 设计主导 |
当核心指标不达标时,通过以下指标定位具体是哪个环节出了问题:
| 指标 | 定义 | 目标 | 采集方式 | 设计可控性 |
|---|---|---|---|---|
| 步骤流失率 | 每步骤开始→完成的流失比例 | 每步 < 10% | 步骤状态变更事件 | ✦ 设计主导 |
| 对比模式使用率 | 完成后查看对比的用户占比 | > 30% | 对比按钮点击 | ✦ 设计主导 |
| 精调打开率 | 进入精调面板的用户占比 | 观察型 ↕ | 面板打开事件 | ✦ 设计主导 |
| 精调修改率 | 打开精调后实际做了修改的占比 | 观察型 ↕ | 编辑操作事件 | ✦ 设计主导 |
| 等待期切走率 | 处理期间切换到其他页面的用户占比 | < 30% | 页面可见性事件 | ✦ 设计主导 |
设计不直接控制,但需要关注——帮助判断体验瓶颈是设计问题还是技术/业务问题:
| 指标 | 定义 | 目标 | 采集方式 | 主要责任方 |
|---|---|---|---|---|
| 平均任务时长 | 上传到最终导出的总耗时 | < 10 分钟 | 时间戳计算 | ◐ 开发 |
| API 调用成功率 | 后端处理接口调用成功 / 总调用次数 | > 99% | 接口状态码埋点 | ◐ 开发 |
| API 平均响应时长 | 每步骤 API 从发起到返回的耗时 | 擦除 < 60s 字幕 < 30s 配音 < 45s | 接口计时埋点 | ◐ 开发 |
| 复访率(7日) | 7 天内再次使用的用户占比 | > 25% | 用户回访日志 | ◐ 多因素 |
| 导出/分享率 | 完成后实际导出或分享视频的用户占比 | > 60% | 导出按钮点击 | ◐ 多因素 |
用户行为漏斗:访问页面 → 上传视频 → 配置参数 → 等待处理 → 查看结果 → 精调/导出 → 复访
每一层的流失率都需要独立追踪,以定位体验瓶颈。特别关注"配置参数→等待处理"(是否理解配置项)和"等待处理→查看结果"(是否因等待过长放弃)两个关键节点。
埋点数据需要可视化看板才能持续监控和快速决策。建议搭建以下三个核心视图:
| 看板视图 | 内容 | 更新频率 | 主要受众 |
|---|---|---|---|
| 漏斗转化图 | 访问 → 上传 → 配置 → 等待 → 结果 → 精调 → 导出 → 复访,每层显示转化率和流失人数 | 实时 / 日更 | 产品 + 运营 |
| 四维雷达图 | 可信任 / 可掌控 / 可找到 / 可共鸣 四维评分雷达图,结合行为指标和测试评分 | 每轮测试后 | 设计 + 产品 |
| 时间趋势图 | 核心指标(完成率、精调率、复访率)的周/月趋势线,标注版本发布节点 | 周更 | 全团队 |
面对 AI 产品,用户从"能用"到"想用"需要跨越四个体验维度。每个维度回答一个关键问题:
敢不敢把任务交给 AI?
能不能干预 AI 的结果?
能不能找到想要的功能?
过程是否有温度?
核心问题:用户敢不敢把自己的视频交给 AI 处理?
设计策略:通过透明化、人格化、专业化建立信任。
| 设计策略 | 产品实现 | 信任机制 |
|---|---|---|
| 角色人格化 | 四位有真名、有专业的 AI 角色(林雨晨/陈默/李明远/苏雅) | 从"系统在处理"变成"有人在帮我" |
| 过程透明化 | 子任务实时拆解:场景检测→文字定位→内容擦除→画面修复 | 用户能看到 AI 在做什么,不是黑盒 |
| 进度可视化 | 角色进度卡片 + 状态点(pending/active/done) | 等待不焦虑,每一步都有反馈 |
| 专业台词 | 角色说专业但不晦涩的话:"信达雅三字,达意之外还要通顺" | 让用户相信 AI 真的理解内容 |
| 导演调度 | 林雨晨统筹全局:"陈默开路,明远跟上,苏雅收尾" | 有组织感 = 有可靠感 |
核心问题:如果 AI 的结果不满意,用户能不能修改?
设计策略:提供多层次、低门槛的精调能力。
| 精调层级 | 操作方式 | 适用场景 |
|---|---|---|
| 擦除区域调整 | 视频上直接拖拽 8 个 resize handle 调整区域框 | AI 没擦干净或擦多了 |
| 字幕逐条编辑 | 精调面板列表 → 点击编辑 → 修改译文/时间 | 翻译不准确、时间不对 |
| 配音逐条编辑 | 精调面板列表 → 编辑译文/起止时间 | 配音语气或时长需调整 |
| 对比验证 | 原片/成片上下对比播放 | 确认 AI 处理效果 |
| 重新生成 | 单步骤重新处理(不需要全部重做) | 整体效果不满意 |
核心问题:用户能不能找到想要的功能?
设计策略:多入口、渐进式披露、智能意图检测。
| 入口类型 | 实现方式 | 解决的问题 |
|---|---|---|
| 路径标签 | Landing 页顶部:新任务 / 导入 | 用户第一眼就知道有两种方式 |
| 模式标签 | 完整 / 字幕擦除 / 翻译 / 配音 | 不是所有用户都需要全部功能 |
| 配置面板 | 按模式动态展示相关配置项 | 减少认知负担,只看相关的 |
| 智能输入 | 底部输入框支持自然语言意图检测 | "帮我把视频翻译成英文"→自动路由 |
| 导入面板 | ID 查询 / 文件上传 / 历史列表 | 多种找回旧任务的方式 |
为什么叫"可共鸣"?
命名由来
四个维度都遵循"可 + 动词"的主动句式(可信任、可掌控、可找到、可共鸣),主语始终是用户。"温暖"是被动接收,"共鸣"是双向发生——产品发出信号(角色台词、叙事弧线、完成仪式),用户接收并回应(投射情感、产生骄傲感、愿意复用)。
英文对应 Emotional Bond(情感纽带),不是 Warmth。Bond 强调的是连接——用户与产品之间建立了一条情感链路。
此外,"温暖"只能覆盖 L1 安心感,而"共鸣"是情感容器词,同时包裹安心(L1)、趣味(L2)、成就(L3)三层,不预设情绪类型,只描述"产品与用户之间产生了情感响应"这一事实。
——不是产品单方面给你温暖,而是你和产品之间一起发生的情感连接。
核心主张:Tideo 有别于同类工具的核心差异,在于我们不止交付功能结果,还交付情绪价值。
情绪价值不是单一的"好不好玩",而是三层递进的情感收益理论来源
综合 Aarron Walter 情感设计金字塔(功能→可靠→可用→愉悦)、Desmet & Hekkert 产品情感框架(审美/意义/情感三层愉悦)及 Csikszentmihalyi 心流理论(低焦虑→沉浸→满足)。三者共同指向:情感体验分层递进,底层不满足则上层无法触发。,每一层是下一层的前提:
通过四层设计策略,在用户旅程的不同阶段交付三层情绪价值:
| 设计策略 | 交付的情绪价值 | 用户旅程阶段 |
|---|---|---|
| 角色人格化 | L1 安心感 | 全程 |
| 等待游戏化 | L2 愉悦感 | 等待处理阶段 |
| 协作叙事感 | L2 愉悦感 + L1 安心感 | 处理推进阶段 |
| 完成仪式化 | L3 成就感 | 结果交付阶段 |
以下是每层策略的具体实现:
| 设计点 | 实现方式 | 情绪作用 |
|---|---|---|
| 四角色有真名 | 林雨晨 / 陈默 / 李明远 / 苏雅 | 从"系统在处理"变成"有人在帮我" |
| 性格差异化 | 陈默寡言:"……坐标锁定。开始抠。" 苏雅活泼:"来啦来啦~" | 角色不是皮肤,是有辨识度的"人" |
| 专业台词 | "信达雅三字,达意之外还要通顺" | 让用户相信背后的 AI 在"理解"内容 |
| 随机问候 | 每角色 3 句问候语随机选择 | 每次体验有微妙差异,不机械 |
| 设计点 | 实现方式 | 情绪作用 |
|---|---|---|
| 视频 Loading 覆盖层 | 擦除/字幕 → translate-loading.mp4 配音 → voice-loading.mp4 | 等待不是空白进度条,是"角色在工作" |
| 台词轮播 | 每角色 7 条工作台词,定时切换 | 等待时有"故事感",像在看幕后花絮 |
| 像素工作室 | 480×360 canvas 星露谷风格场景 | 审美情趣的共鸣——像游戏,不像工具 |
| 角色行走动画 | 角色在工作室中走动、召唤、对话 | 动态感,角色"活着" |
| 设计点 | 实现方式 | 情绪作用 |
|---|---|---|
| 导演调度台词 | "陈默开路,明远跟上,苏雅收尾" | 用户不是在操作系统,是在看团队协作 |
| 步骤接力 | 擦除→字幕→配音,每步有角色交接 | 叙事弧线——开场→推进→高潮→收尾 |
| 杀青仪式 | "各位——杀青了" + 关灯聚光效果 | 完成感的仪式化放大 |
| 聊天时间线 | 加入→问候→进度→结果 | 回溯时像完整的"协作记录" |
| 设计点 | 实现方式 | 情绪作用 |
|---|---|---|
| 关灯聚光灯 | 暗幕遮罩 + 视频发光 + 渐入动画 | 电影首映式——"这是你的作品" |
| 对比模式 | 原片/成片上下对比同步播放 | 成就感——"AI 真的帮我完成了这么多" |
| 步骤完成闪光 | CSS 闪光 + 刷新动画 | 正反馈微交互——每步都有"成了!" |
每层情绪价值通过行为代理(埋点)+ 主观量表(问卷)+ 深度访谈(定性)三种方式交叉度量:
| 情绪层 | 测量方式 | 具体指标 | 目标值 |
|---|---|---|---|
| L1 安心感 | 埋点 | 等待期页面留存率 — 处理期间用户未切走的比例 | > 70% |
| 量表 | SAM 唤醒度(Arousal)— 在"等待处理"节点评分 1-9(越低越平静) | ≤ 4 分 | |
| 访谈 | "等 AI 处理时你在想什么?" — 编码为正面/中性/负面 | 负面 < 20% | |
| L2 愉悦感 | 埋点 | 聊天面板浏览率 — 处理期间滚动/查看聊天面板的用户占比 | > 50% |
| 埋点 | 角色台词停留时长 — 聊天气泡出现后用户在页面的平均停留时间 | > 3 秒/条 | |
| 量表 | 等待体感比 — 用户估计的等待时长 ÷ 实际等待时长 | < 1.0 | |
| 访谈 | 角色投射测试 — "给某个角色写一句评价" — 是否出现拟人化表达 | ≥ 60% 拟人化 | |
| L3 成就感 | 埋点 | 仪式感交互率 — 对比模式使用 + 聚光灯阶段停留 > 5 秒的用户占比 | > 40% |
| 量表 | SAM 愉悦度(Valence)— 在"看到结果"节点评分 1-9 | ≥ 7 分 | |
| 量表 | 情感词汇测试 — "用三个词描述体验" — 正面词占比 | > 70% 正面 | |
| 访谈 | 复用意愿探查 — "下次会回来用吗?" — 提及体验感受的比例 | ≥ 40% 提及感受 |
通过真实用户的操作观察与感受访谈,验证四维体验模型的实际落地效果。
确保所有测试在一致的条件下进行,减少环境干扰:
| 准备项 | 要求 | 备注 |
|---|---|---|
| 测试版本 | 线上部署版(GitHub Pages),与用户实际使用环境一致 | 避免使用本地 localhost,防止网络差异影响结果 |
| 设备要求 | 桌面端浏览器(Chrome 最新版),屏幕分辨率 ≥ 1280×800 | Tideo 目前仅适配桌面端,测试需统一浏览器 |
| 网络环境 | 稳定 Wi-Fi(≥ 10Mbps 下行),避免公共网络不稳定 | 视频上传/加载对网速敏感 |
| 标准测试视频 | 准备 2-3 个标准测试视频(30s-2min,含外文字幕),测试员预先验证可正常处理 | 避免用户自带视频出现格式兼容问题 |
| 录屏工具 | OBS 或系统自带录屏,需录制屏幕 + 麦克风(用户出声思维) | 确保事先测试录屏工具正常工作 |
| 观察笔记模板 | 预设行为编码表:卡点位置、情绪标注、求助次数、关键引语 | 测试员提前熟悉编码规则 |
| 账号准备 | 为每位参与者准备独立测试账号(避免历史数据干扰) | 测试前清空任务记录 |
由产品经理从真实客户中招募,确保参与者是有实际需求的目标用户(非内部同事),覆盖以下画像:
| 用户类型 | 画像特征 | 人数 | 验证重点 |
|---|---|---|---|
| 业务运营人员 | 非技术背景,日常使用办公软件,有视频翻译需求 | 2-3 人 | 可找到 + 可信任 |
| 内容创作者 | 有视频剪辑经验,对画质/配音有要求 | 1-2 人 | 可掌控 + 精调体验 |
| 产品/项目经理 | 需要评估工具能力,关注效率和效果 | 1-2 人 | 全流程完成度 |
每位参与者依次执行以下任务,测试员仅在用户明确求助时才介入("think aloud"协议):
| 任务 | 描述 | 维度 | 观察要点 |
|---|---|---|---|
| T1 找到功能 | "请在这个网站上找到视频翻译功能,并开始一个新任务" | 可找到 | 入口是否清晰?需要几次点击? |
| T2 上传配置 | "上传提供的测试视频,选择完整翻译模式,开始处理" | 可找到 可信任 | 上传流程是否顺畅?配置项是否理解? |
| T3 等待观察 | "请等待 AI 处理完成,期间你可以自由浏览页面" | 可信任 可共鸣 | 是否切走?是否看角色对话?等待时的情绪? |
| T4 查看结果 | "处理完成后,查看 AI 的处理结果" | 可信任 | 是否理解结果展示?对聚光灯效果的反应? |
| T5 精调操作 | "请修改第 3 条字幕的翻译,并调整一个擦除区域的位置" | 可掌控 | 能否找到精调入口?操作是否直觉? |
| T6 对比导出 | "对比原片和成片效果,然后导出最终视频" | 可掌控 | 对比功能是否被发现?导出流程是否完整? |
| 阶段 | 时长 | 内容 | 记录方式 |
|---|---|---|---|
| 开场介绍 | 5 分钟 | 说明测试目的(测产品不测人)、签署知情同意、开启录屏 | 录屏软件 |
| 自由探索 | 3 分钟 | 用户自由浏览页面,说出第一印象 | 观察笔记 + 录屏 |
| 任务执行 | 20-30 分钟 | 依次执行 T1-T6,全程 think aloud(边操作边说出想法) | 操作录屏 + 观察笔记 + 计时 |
| 半结构化访谈 | 10-15 分钟 | 针对体验感受进行深度访谈(见下方访谈提纲) | 录音 + 笔记 |
| 问卷填写 | 5 分钟 | SUS 量表 + 情感体验评分 + NPS | 问卷工具 |
访谈围绕四维模型设计,每个维度对应 2-3 个核心问题:
| 维度 | 访谈问题 | 探测目标 |
|---|---|---|
| 可信任 | "你第一次看到 AI 开始处理时,心里是什么感觉?" "你觉得这些 AI 角色可靠吗?为什么?" | 用户对 AI 的初始信任度 角色系统是否建立了信任 |
| 可掌控 | "如果结果不满意,你知道怎么修改吗?" "精调操作的时候,你觉得容易还是困难?" "你觉得自己对结果有多大的控制权?" | 精调功能的可发现性 操作难度感知 掌控感是否到位 |
| 可找到 | "有没有哪个功能你想用但找不到?" "第一次进入页面时,你知道该从哪里开始吗?" | 信息架构的清晰度 首次使用引导效果 |
| 可共鸣 | "等待处理的时候你在干什么?感受如何?" "你对页面上的角色们有什么印象?" "完成后看到聚光灯效果时,你的反应是什么?" "如果用三个词形容这次体验,你会说什么?" | 等待体验质量 角色感知度 仪式感效果 整体情绪基调 |
| 数据类型 | 采集方式 | 分析方法 |
|---|---|---|
| 任务完成率 | 每个任务:成功/失败/需要帮助 | 按任务统计完成率,定位瓶颈步骤 |
| 任务耗时 | 每个任务的起止时间 | 与预期时间对比,识别卡点 |
| 操作路径 | 录屏回看 + 操作日志 | 绘制用户实际路径 vs 预期路径 |
| 错误次数 | 误操作、回退、求助的次数 | 高频错误 → 对应界面改进点 |
| SUS 评分 | 10 题标准化量表 | 评分 > 68 为可接受,> 80 为优秀 |
| 情感评分 | 四维各打 1-5 分 | 每维度平均分 + 最低分维度 |
| NPS 净推荐值 | "你会推荐这个产品吗?0-10" | NPS = 推荐者% - 贬损者% |
| 开放题关键词 | 三词描述 + 访谈关键句 | 情感词云 + 高频主题聚类 |
测试结束后,产出以下交付物:
| 交付物 | 内容 | 用途 |
|---|---|---|
| 可用性问题清单 | 按严重程度(P0-P3)分级的问题列表,每个问题附场景截图 + 改进建议 | 指导迭代优先级 |
| 四维评分雷达图 | 每个维度的平均分可视化,直观展示体验强项和短板 | 向上汇报 + 团队对齐 |
| 用户旅程热力图 | 标注情绪高点/低点的全流程地图 | 识别关键体验时刻 |
| 关键发现报告 | 5-8 条核心 insight,每条附数据支撑 + 用户原话 | 产品决策依据 |
| 迭代建议排序 | 基于"影响面 × 实现成本"的优先级矩阵 | 开发排期参考 |
埋点指标 × 四维度映射
| 维度 | 行为指标(埋点) | 主观指标(测试/问卷) | 目标 |
|---|---|---|---|
| 可信任 | 任务启动率 等待期页面停留率 首次完成率 |
SUS 评分中信任题项 "你觉得 AI 可靠吗?" |
启动率 > 90% 停留率 > 70% |
| 可掌控 | 精调面板打开率 精调修改率 修改后导出率 |
"你觉得能控制结果吗?" 操作难度评分 |
打开率 > 40% 修改率 > 60% |
| 可找到 | 功能入口分布 智能输入使用率 帮助/FAQ 触发率 |
"有没有想用但找不到的?" 任务 T1 完成时间 |
T1 < 30秒 帮助率 < 15% |
| 可共鸣 | 聊天面板浏览率 等待切走率 对比模式使用率 复访率 |
情绪价值总分(L1+L2+L3) 等待体感比 "三词描述"正面词占比 角色拟人化表达率 |
情绪价值 ≥ 9/15 切走率 < 30% 复访率 > 25% |
验证不是一次性的——每次产品迭代后都需要重新度量,形成「设计 → 埋点 → 测试 → 洞察 → 迭代」的持续闭环:
| 闭环阶段 | 动作 | 输出 |
|---|---|---|
| ① 设计迭代 | 基于上轮测试的洞察,针对性优化体验短板 | 设计方案 + 开发需求 |
| ② 埋点更新 | 新功能补充埋点事件,旧指标保持可对比 | 更新后的事件列表 |
| ③ 数据观察 | 上线 1-2 周后观察看板指标变化趋势 | 指标趋势报告(标注版本节点) |
| ④ 轻量复测 | 邀请 2-3 名用户做 30 分钟快速测试,聚焦改动部分 | 问题清单 + 主观评分对比 |
| ⑤ 洞察沉淀 | 对比历次测试数据,识别长期趋势和反复出现的问题 | 趋势分析 + 下轮优化方向 |
前三个维度解决的是功能性问题——用户能否完成任务;"可共鸣"解决的是复用动机问题——用户不是因为没有替代方案才回来,而是因为这个过程本身让人觉得舒服。
这正好呼应了业务目标中最关键的三个字:"愿复用"。
埋点数据告诉我们"发生了什么"
四维模型帮我们理解"为什么这样设计"
可用性测试验证"用户实际感受如何"
三条线交叉验证,形成定量 + 定性 + 实测的完整证据链。
以下是本框架中使用的全部量表和问卷,已针对 Tideo 产品语境定制。点击卡片可查看完整内容。
愉悦度 + 唤醒度双维度评分,在等待和结果两个节点采集
10 题标准化可用性评估,语境已适配 Tideo
推荐意愿评分 + 开放题追问
安心感 / 愉悦感 / 成就感三层评分 + 体感比
四维度 × 12 个核心问题 + 追问引导