声明:本文来自于微信公众号超级王登科(ID:superwdk),作者:DK本人,授权转载发布。
这篇文章在去年 6 月首发于面包多,是我的第一篇付费作品,在一年后,我将它完全免费公布出来,并加上了一些更新内容,希望能对更多开发者或对产品有热爱的人提供一些参考和灵感。
2019 年 4 月,我打算拍 Vlog,之所以要做这件事,其实也没有太多理由,主要就是因为在微博和B站看到好多人拍,就也想试试。
我当时买了一箱军罐头,然后拍了吃罐头的一个Vlog,拍完之后,我觉得我说话不是特别清晰,于是就想着搞个字幕,但是我发现,「搞字幕」这件事太他妈复杂了。
按照传统的办法,需要人手动把听到的话写下来,然后再在合适的时间插入进去,「合适的时间」包括起始两个时间点,这几乎是双倍的工作量了,这还不包括软件的学习成本(Pr,FCP等)。
那有没有简单一点的办法呢?经过我的一番搜索,我发现网易和讯飞提供机器识别的服务,但是价格嘛, emmm
讯飞比较便宜,0.33/分钟,网易就比较坑了,机器最便宜也是 1 块/分钟。
这两家我也都用了,我发现有一点很不人性化:网易也好讯飞也好,最后只会给你一个 SRT 的字幕文件,并不会给你加好字幕的视频,对于专业做视频的人来说当然很简单,但对于我这种偶尔才拍一个视频,寄希望于得到一个加好字幕的视频,然后去上传B站,微博的人来说,有那么一点鸡肋,因为我还是得打开Pr,FCP 这种大软件去导入然后渲染,这样总共几个小时还是少不了。
那么,有没有可能做一个纯粹的「加字幕」工具呢?
这是我灵感的来源:通过自己遇到的问题不能被很好满足所带来的需求。
接下来的一周,我每天大概花 5 个小时来开发这样一个字幕工具,从技术上来说,核心的难点在「识别语音和时间轴」,这一点我花了不少时间,但通过爆改已有的轮子,还是实现了出来(ffmpeg大法好)。不过除了核心之外,这个产品有许多细节要注意,比如 SRT 的文件格式,时间轴编辑等等。
我花了大约 5 天来开发这个产品,在搞定「语音识别」之后,其他部分都是一些 CRUD 的活儿,这个很快就能完成。
最终实现的产品有如下功能:
「自动翻译并生成双语字幕」是第二周根据用户的需求加上的,直接使用了百度翻译的 API,效果还不错。
关于这个产品应该叫什么名字,我花了一些时间来想,我首先想到的是「视频to字幕」,然后就想到了「to字幕」,然后想到了「突字幕」这个名字,感觉还行,就直接用了。
4 月 26 日,产品做好之后,我在一些常规渠道做了很简单的推广:知乎发帖,豆瓣摄影小组发帖,然后投稿给了少数派,小众软件等媒体,当天差不多来了 400 人。
当然你可以看到,第二天流量就下降了一小半,事实上,产品在渠道新曝光之后,如果没有持续的正常运营策略,数据是肯定会掉的。
意外发生在第三天,少数派发完贴后,我在文末加了一句「回复你的ID,免费赠送 600 点数」,这个做法让我的帖子相当活跃,一天之后,少数派的创始人老麦看到了这个帖子,顺手发到了微博上,老麦的这条微博在短暂发酵后一路扶摇直上,获得了超过 5 万次转发。
这条微博的阅读量超过千万,在让老麦升级成为金V的同时,也让突字幕迎来了流量的峰值:
当天超过 2.5 万人访问突字幕,其中一万人注册成为用户,并上传了总共超过1TB的视频。
因为不确定产品可能存在的问题,所以我使用了客服组件「tidio」,这是一个国外的产品,它最大的优点是非常简单,而且好看,我知道国内有美洽之类的产品,但是由于审美不符合,所以我比较抗拒。
通过 tidio ,有上百名用户过来和我留言,他们说到了大量的突字幕的问题,以及希望得到的 feature,我把这些都记录了下来,并且制定了更新计划,预计在未来一段时间里逐渐更新。
在收入方面,突字幕的数据还算不错,总付费率为7%
突字幕使用微信收款,收费方式为点数充值, 2019 年的 5 月一整月的收入为 2 万出头:
我对于这个数据挺满意的,不过之后的几个月数据有不少下滑,一方面是因为微博热度过去的,流量下降了一部分,另一个原因是产品确实还不够好,没有满足很多用户的期待。
在增长方面,我一共在产品内部嵌入了两个功能,一个是「免费获得点数」,一个是「推广突字幕赚钱」,这两个功能都是在产品上线 4 个月之后才开始加入的,理由我稍后会写。
当用户用突字幕给视频加了字幕后,多半会发在某个地方,比如微博啦,B站啦,头条啦什么的,这时候如果用户在发视频的地方介绍一句突字幕,我就会返还他处理这个视频所消耗的点数。
我用一个表单来实现这个功能,让用户手动填写表单
当用户填写表单后,我会收到微信通知,然后搂一眼是不是真的,如果是真的就通过直接改数据库给他返还点数(是的我根本没做后台之类的东西)
「推广突字幕赚钱」则是一个最简单的分销,总的来说它的效果反而还没「免费获得点数」的效果好。
这就是我在产品里面加入的所有增长措施。
突字幕让我明白的最重要的事情之一是,有时候,在产品早期,凭靠好运气获得大流量也不一定是一件好事,如果产品准备的还不好,那么就会有许多用户白白流失掉,突字幕在巨大流量涌入后,因为产品还不够完善,用户的流失比较严重。
由此可知,任何产品,在早期都不可能是尽善尽美的,如果打分从 1 到 100 分, 1 分意味着产品什么功能都没有,体验糟糕, 100 意味着绝对的完美,那么大多数产品,可能都介于 40 分- 80 分之间,问题是,产品该达到多少分,才能让我们有信心的推入市场,甚至迎接突如其来的爆发流量,并且能在此后不惋惜「要是产品准备的再完善一点就好了」
这个问题并非一句「越完善越好」就能回答,因为花在产品上的时间越多,不确定性越多,也可能造成机会的错失。因此,我们不可能等产品做到接近 100 分才将其发布:时间,预算,甚至市场都无法等待这么长时间。
我的答案是 65 分,这个分数意味着产品「满足核心需求」,「体验略高于平均水平」,其余诸如增长模型,花哨的邀请分享按钮,后台统计&管理( 一般数据看Google analytics,业务数据直接看数据库 ),少部分浏览器的适配,可能会对用户有用但不是核心需求的功能等等,都暂且放下,这样一个产品,就是 65 分的产品,如果能达到这个标准,就立刻拿去接受市场和用户的检验。
我的逻辑是,如果你的产品不能满足核心需求,或者产品体验糟糕,那么大多数用户会愤怒的离开,不要奢望他们点你精心设计的分享按钮——他们不在社交网络上骂人就谢天谢地了,他们自然也不会关心其他非核心功能。而如果你把核心需求解决了,产品体验也尚可,如果这个需求真的存在,那么,他们是会回来的,验证这一点,然后赶紧把其他该做的做出来,终有一刻,他们是一定会点分享按钮的~
突字幕现在已经更新了一个版本,这次我和同事一起,努力把这个产品从「由一个idea诞生的独立开发作品」变成一个小而美的精致工具。我毫不隐藏:我希望突字幕能够成为赚钱机器,但我也发自内心的希望这是一个帮助人们增加效率的,被大家喜爱的工具,并且我还坚定的认为,这两者不仅毫不冲突,且息息相关。
2020 年 7 月 9 日后记
2019 年的 4-6 月,我把突字幕改了几个版本,并在2019 年 6 月完全成型,你现在看到的,就是那个时候的版本。
到今天,「字幕识别」这个市场已经发生了比较大的变化,诸如剪映等一系列App 都集成了字幕识别功能,且效果和体验都非常棒,这近一步压缩了突字幕的目标市场,但因为对长视频的支持,突字幕还是有比较稳定的用户和收入,不过大概只有最高峰时候的一半到三分之一,也就是每月大几千元的收入。
和我之前做的小工具一样,突字幕是一个「无需干预,无需正常运营」的产品,我除了看用户反馈外,一周花在它上面的时间不到一个小时,从好的一方面说,它是一个完全标准的「被动收入机器」,但实话实说,它也很难成长为一个更大的机会。
总的来说,悠闲的事情往往不赚钱,赚钱的事情往往不悠闲,既悠闲又赚钱的事情,反正我是没见着。