安可推荐系统开发笔记（2）

发表于 2017-12-29

所有代码都已开源

安可推荐后端：Encore
安可推荐前端：Hexo文章推荐

在开发笔记的第一篇里，我讲了为什么要开发这个系统和为什么要开源。第二篇，我想介绍一下我的开发思路。简单的说，就是用最快的速度发布最小可用产品，来验证想法的可行性。

虽然是做一个开源软件，但我把它当成一次创业来对待的。在我的上次创业经历中，踩过一个坑，就是耗费了时间和精力的一款产品，在发布完的时候，没人用。这次为了避免走老路子，我做了两个调整，为了从第一天起就建立起来反馈循环。

先做市场调查
最快速度发布最小可用产品

市场调查

我把市场调查的范围限制在我比较熟悉的领域里。我使用的博客基于Hexo框架，主题来自于Hexo-Next-Theme，所以我在这两个圈子里发了市场调查（1， 2）。结果并没有想象中的那么理想，响应的人并不多。不过还是有收获的，主要分为三个方面。其一，有些人排斥在推荐文章里使用互换连接的想法，认为这伤害了博客的独立性。其二，有些人虽然对该想法持接受态度，可担心潜在的性能问题。其三，也是我们所谓的天使用户，有一个非常乐观开放的博主乐意尝试这个想法。

除了市场调查之外，我还和朋友聊我的想法。其中一个博主朋友（法国朋友，Octopress博主）说，他愿意付费使用这个服务，另一个（法国朋友，WordPress博主）说这是一个非常好的想法。还有一个朋友（中国朋友，写过博客但放弃了），说为什么要做一款无觅已经做过的产品，后来发现无觅已经退出博客圈去做金融科技去了。显然，不同背景的朋友，有不同的想法，但都非常具有参考意义。

不论是从Hexo圈子里，还是从朋友那里，都是喜忧参半的结果。可不论如何，我找到了一个愿意和我合作把点子实现的朋友。

最小可用产品

在我上次组织的精益创业演讲里，就接触到了最小可用产品（Minimum Viable Product）的概念。其目的，就是最快的发布一个可用但功能比较局限的版本来收集用户反馈。我们的MVP是什么？

系统大概架构

系统架构，包括两部分，一是后端服务器，负责推荐算法的实现，二是前端Hexo插件，显示推荐文章列表。

数据收集

说完了算法，人工智能里不可或缺的就是数据。如何采集数据是必须解决的问题。这时候，很多朋友会想到要使用爬虫爬取博客文章，提取它们的标签。可这不仅在工程量上比较大，而且还需要很多的计算资源。我暂时舍弃了这个想法。由于我控制前端的实现，最简单的方案，就是让前端主动上传推荐需要的数据。这样不仅减少了工程量，而且也大大削弱了对计算资源的需求。

结语

通过最初期的市场调查，我发现产品虽然有很多阻力，但除了我之外，还是有人愿意尝试的。其次，就是通过对推荐系统的简化，我找到了在一周以内就能发布的解决方案，即便失败了，也最多丢了一周的时间，可以一试。在接下来的开发笔记里，我会给大家讲一下MVP的具体实现，其中会涉及到Spring Boot 2.0，Node.js Promise，Docker容器和服务器的选择。

所有代码都已开源

市场调查

最小可用产品

系统大概架构

推荐算法

数据收集

结语

推荐文章（由hexo文章推荐插件驱动）