王辉的博客

是什么让我对未知世界始终充满热情?

过拟合(Overfitting),是机器学习里很容易犯的错误。观察琢磨之后,发现,不仅是在机器学习里,在生活,学习,工作,特别是创业中,也需要我们多加小心。

什么是过拟合

什么是过拟合?让我们举个考试的例子说明,我敢保证,如果你是学霸没经历过,你身边的吃瓜群众肯定有过。

说快要期末考试了,大辉有点慌,因为整个学期把功夫都用到了小微身上。临考前几天,他搜集到了过去五年的期末考卷,疯狂的刷题,背答案。经过通宵达旦的训练,终于把五套卷子烂熟于心。考试的日子到了,大辉脚步轻盈的走进教室,扫了小微一眼,信心满满的坐下,心想,一定要第一个交卷,让小微崇拜一下。可当他拿到试卷的时候,发现失策了,之前的五套试卷都白背了,一个题都没能再现。这就是过拟合,你把全部精力都放在了过往的数据上,而当不确定的未来真正来临的时候,你惊鄂的发现,在猛虎面前,你拿了个苍蝇拍。

考试的例子,通俗易懂。在机器学习里的过拟合,看起来高深莫测,也是同样的道理。说你要做一项研究,预测一个人的幸福感和婚龄的关系。你做了很多调研,统计了很多人在结婚前三年和后三年的幸福感,然后用了很多参数画了一条美妙的曲线,把大家的幸福感都准确的圈到了,你觉得你发现了史上最重要的幸福定律。然而当你拿着你的曲线,去问一对在一起四十多年的夫妇的时候,你发现,你的曲线就其实是个笑话。

不过话说回来,过拟合也不是你想办就能办的到的,只有像诺依曼那样的人才能说出这样的话,“用四个参数我可以拟合出一头大象,而用五个参数我可以让它的鼻子摆动”。

为什么会出现过拟合

为什么会出现过拟合?因为你太天真了。还拿考试的例子来说。过去五年的试卷,先不说你收集的是不是假试卷,即便是真的,出题的教授,今年也很有可能被勇敢的女学生举报。然后,新老师为了学生的前途负责,把题换了。机器学习也是同样的套路,不要天真的以为,眼前的训练数据,都是出淤泥而不染的青莲,它们很可能都沾上了污泥,你得用清水给冲净了,再用,即便表面冲净了,可你能确定它们的心是红的吗?

所以,当你根据已有数据,做决定的时候,一定要考虑到他们的不确定性。如果你明明知道,帮你做决定的数据,本身就存在不确定性,你还会在他们身上浪费大量的精力吗?感谢巴黎大数据从业交流微信群,从业界的最前线给我分享了,在深度学习里使用贝叶斯方法来处理模型不确定性的论文,这让我深受鼓舞,说明我们找到了数学的方法,来解决我们过于天真的问题。

过拟合的危害

如果,你只是因为死记硬背往年试卷,挂了科,那么你还有补考的机会。可如果你在创办企业,过拟合,会让你花光所有的钱,用尽所有人的耐心,做出一款没人用的产品。说白了,过拟合的危害,就是造成没必要的浪费。

在创业的过程中,你有一个令人魂牵梦绕的点子,初期在朋友中的调查也反响特别好,你觉得这个产品能改变世界。如果你握着这个点子和朋友的鼓励,闭门造车,那么你很可能就是在天真的过拟合了。而明白过拟合危害的创业者,会时刻提醒自己,所有的点子,所有的反馈,都存在不确定性。我的目的,是在漆黑的道路上,不断的摸索,利用这些不确定的微光,在所有的资源耗费殆尽前,找到一条可以盈利的路。

缓存,从兜里的手机,到家里的厨房,再到我们的大脑,无处不在。了解缓存,不仅能让你成为一个更好的程序员,更能让你在生活中成为一个利用空间的能手。不出意外的话,还能帮你理解处在风口浪尖上的“新零售”的概念。

什么是缓存

我保证,你不听我的解释,就可自己找到答案,你只需要在厨房里转一圈。如果你现在进不了厨房,就可在脑子里设想一下,请不要错过这个主动学习的机会。

我找到的缓存,是冰箱。它缓的是离我家十公里外的一个中国超市(巴黎一共没几家中国超市,所以离的远很正常)。当我想喝一瓶青岛啤酒的时候,我就想它在冰箱里冷冷的等着我,不用想喝的时候,还得开车到十公里以外的超市里去买。

所以缓存是什么?缓存是一块存储空间,能把东西从很远的地方存到里消费者更进的地方。冰箱是超市的缓存,家里的书桌是图书馆的缓存(如果你借书的话)。CPU旁边有内存的缓存。

缓存满了怎么办

世界杯的夏天,你会买上一箱啤酒,放到冰箱里,可发现冰箱满了。这时候你要给啤酒腾地方。你会选择消灭什么?这个问题我专门请教了我老婆,她选择那些快过期的东西。经济的角度上,可以解释,这些东西快过期了,再不吃就可能扔了。问题和答案都非常简单,却反映了缓存里最重要的问题:缓存的置换算法。

大家仔细想一下,冰箱里为什么会出现快过期的东西呢?因为这些东西,你不常用。不常用的东西,为什么要放冰箱里呢?请注意,这里是你成为生活中利用空间能手的机会。不常用的东西,就不要缓,万一缓上了,也要优先置换掉。离你近的缓存都是非常昂贵的,除了你家的冰箱,还有你家的储物间,房价那么贵,如果你缓了一个占地一平方米的东西,还不常用,那我劝你,算算它值不值你那一平方米的房价。

不缓,那需要的时候怎么办?直接去超市买吧。设想如果超市就开在你家楼下,你打个电话两分钟就能送上来,这时候你还需要冰箱吗?罗振宇在刚过去的跨年演讲里说道,现在还没有多少人能把新零售讲明白,我觉得不妨从缓存的角度一试。

这里打个岔,如果你是一名程序员,你一定要知道LRU(least recent used)的算法,因为它在缓存置换里扮演着非常重要的角色,如果你还是一个Java程序员,你一定要知道LinkedHashMap是怎么实现的,因为那里有你需要的LRU。

缓存的大小

大家有没有注意到,越是近的缓存,它就越小(比如CPU里的一二三级缓存)。有些人认为这是造价的问题,但比造价更重要的,是查找速度。试想一下,如果把你家的冰箱,变成了一个大冰库,你从里面拿出一个鸡蛋的时间必定要更长。

一旦明白了东西越大,查找所需时间就越长的道理,我们就不难明白,为什么人越老越容易记不起来事情。人老了,并不是大脑转不动了,而是随着阅历的增加,人脑里存放的东西变多了。一个十几岁的初中生,记一个东西,只需要在十年的东西里找个缝,七十多的老爷爷,要在七十年的光阴中找个缝,你说谁快谁慢。

结语

你能忘记什么,和你能记住什么一样重要。

友情链接,八年前我写博客的时候就存在了。在人工智能蓬勃发展的今天,友情链接如何完成升级换代?

什么是友情链接

什么是友情链接,举个简单的例子来说明。说在一条街上,有两家店,一个是卖鲜花的,一个是买巧克力的。

情人节了,你准备给女朋友买个礼物,碰巧到了鲜花店,买了一朵鲜艳欲滴的玫瑰,交完钱要走的时候,老板给你说,对面的那个巧克力店特别棒,如果你能给你女朋友再送一盒巧克力的话,她肯定爱你爱的不能自拔。你有一个好朋友,大壮,也是情人节当天买礼物。他先晃进了巧克力店,买了一盒比利时进口巧克力,刷完卡要走的时候,老板说,巧克力要是再能配上一束鲜花的话,你女朋友肯定会爱你爱的欲罢不能,正好对面有一家鲜花店,你要不要去看看。

一个鲜花店,一个巧克力店,两位老板私下里达成共识,互相推荐彼此的产品。因为他们明白,这样能让每一个客户都能给他们的情人买双份的礼物,既能促进别人的感情,又能增加彼此的销售额。

如果把上面的老板,换成写博客的,两人互相推荐博客,就是所谓的友情链接。

友情链接需要升级换代

博客间的友情链接,不仅能帮助读者发现更多有意思的内容,还能彼此推广自己的博客,多么好的发明!然而,现实却没有那么美好,友情链接存在很多可以改进的地方。

寻不到的朋友

友情链接,顾名思义,建立在友情的基础上。交换链接前,得先培养友情关系。虽不是上刀山,下火海,但至少双方要说过两句话。所以得花上一些功夫,先结识愿意和你交换链接的朋友。可茫茫人海中,怎么寻到有缘人,这是友情链接需要改善的地方。

无力的推荐

找到朋友之后,你们达成了共识,交换了链接。可一个链接干巴巴的摆在那,说不清道不明。读者朋友,也不确定点进去,是惊喜还是惊吓。所以,传统的友情链接,缺乏说服力。

信任危机

有些博主,通过努力,把博客搞火了。却发现都是自己给别人带去读者,而很少有读者被带进来。心里不平衡,开始撤销友情链接,脾气不太好的,直接单方面撤销。如何解决不平等的链接交换,消除信任危机,也是一大难题。

人工智能的力量

针对以上的问题,大数据,人工智能可以给我们带了一些新思路。

通过大量的收集有交换意愿的博客,我们可以帮助博主们更高效的找到志同道合的朋友,这个道理,就像那些相亲网站一样。然后通过算法的迭代,可以为每篇文章都找到最精准的推荐,保证你只会给你的读者带来惊喜,永远没有惊吓。最后,通过对个人贡献的量化分析,我们可以保证,链接交换只发生在同样优秀的人之间。

Hexo文章推荐推荐是我为此所做的一个尝试。

所有代码都已开源

在开发笔记的第一篇里,我讲了为什么要开发这个系统和为什么要开源。第二篇,我想介绍一下我的开发思路。简单的说,就是用最快的速度发布最小可用产品,来验证想法的可行性。

虽然是做一个开源软件,但我把它当成一次创业来对待的。在我的上次创业经历中,踩过一个坑,就是耗费了时间和精力的一款产品,在发布完的时候,没人用。这次为了避免走老路子,我做了两个调整,为了从第一天起就建立起来反馈循环

  • 先做市场调查
  • 最快速度发布最小可用产品

市场调查

我把市场调查的范围限制在我比较熟悉的领域里。我使用的博客基于Hexo框架,主题来自于Hexo-Next-Theme,所以我在这两个圈子里发了市场调查(12)。结果并没有想象中的那么理想,响应的人并不多。不过还是有收获的,主要分为三个方面。其一,有些人排斥在推荐文章里使用互换连接的想法,认为这伤害了博客的独立性。其二,有些人虽然对该想法持接受态度,可担心潜在的性能问题。其三,也是我们所谓的天使用户,有一个非常乐观开放的博主乐意尝试这个想法。

除了市场调查之外,我还和朋友聊我的想法。其中一个博主朋友(法国朋友,Octopress博主)说,他愿意付费使用这个服务,另一个(法国朋友,WordPress博主)说这是一个非常好的想法。还有一个朋友(中国朋友,写过博客但放弃了),说为什么要做一款无觅已经做过的产品,后来发现无觅已经退出博客圈去做金融科技去了。显然,不同背景的朋友,有不同的想法,但都非常具有参考意义。

不论是从Hexo圈子里,还是从朋友那里,都是喜忧参半的结果。可不论如何,我找到了一个愿意和我合作把点子实现的朋友。

最小可用产品

在我上次组织的精益创业演讲里,就接触到了最小可用产品(Minimum Viable Product)的概念。其目的,就是最快的发布一个可用但功能比较局限的版本来收集用户反馈。我们的MVP是什么?

系统大概架构

系统架构,包括两部分,一是后端服务器,负责推荐算法的实现,二是前端Hexo插件,显示推荐文章列表。

推荐算法

推荐算法,大家研究的比较透,大概有三种,一是根据用户的喜好推荐,如果用户给某些文章点赞了,我们应该能从他过去的使用习惯中推算出他可能喜欢的内容。第二是内容相似法,完全抛去用户的喜好,只看内容。还有更为先进的算法,就是引入社交网络的概念,如果你的亲近朋友喜欢了一样东西,那么基于人以群分的定理,你应该也会喜欢同样的东西。

显然,只有内容相似法,有可能在一周的时间内实现。即便只基于内容,不考虑用户个性化,我们也面临分析内容相近性的挑战,吴军在数学之美里,给大家讲了如何使用余弦定理来判断文章的相似性,一个高中生就能用的余弦定理,理论上简单,但实践起来,要求我们搞定自然语言处理中的分词算法等等,所以这也不太现实。

我最终的选择,是最简单的标签对比法,具体实现可见源代码,大概意思是说,如果两篇文章如果同时被打上一样的标签,那么它们就是相似的,就可以推荐,如果没有相同的标签,则不相似。

数据收集

说完了算法,人工智能里不可或缺的就是数据。如何采集数据是必须解决的问题。这时候,很多朋友会想到要使用爬虫爬取博客文章,提取它们的标签。可这不仅在工程量上比较大,而且还需要很多的计算资源。我暂时舍弃了这个想法。由于我控制前端的实现,最简单的方案,就是让前端主动上传推荐需要的数据。这样不仅减少了工程量,而且也大大削弱了对计算资源的需求。

结语

通过最初期的市场调查,我发现产品虽然有很多阻力,但除了我之外,还是有人愿意尝试的。其次,就是通过对推荐系统的简化,我找到了在一周以内就能发布的解决方案,即便失败了,也最多丢了一周的时间,可以一试。在接下来的开发笔记里,我会给大家讲一下MVP的具体实现,其中会涉及到Spring Boot 2.0,Node.js Promise,Docker容器和服务器的选择。

所有代码都已开源

作为开发笔记的第一篇,我想给朋友们说清两个事:一是为什么要开发一个博客推荐系统,二是如何开发。

为什么开发博客推荐系统

因为我想帮助写博客的人,让他们的生活变得更加美好。如果你去问一个写博客的人,什么样的生活更好?我敢保证,至少有一个人会说:”我希望我的文章能帮助更多的读者“。如果你找不到一个这样的人,那么你可以来问我,我会一字不差的这样回答你。

作为一个写博客的人,为了帮助更多的读者,最重要的一条是创作优质的文章。但优质的文章不是一天两天的功夫就能写成的。这需要大量的练习,不断的收集读者的反馈,持续的改进。这其中很重要的一环,就是读者的反馈。不论是写博客,做产品,还是提供服务,没有反馈,就不可能有质量的提升。如何收集反馈?重中之重是为你的文章找到读者。

为文章找读者,就像为产品找买家一样,属于市场营销的范畴。厂商为产品找买家,做法大家都知道,就是推广。写博客,也可以使用同样的手段:推广文章。博客推荐系统,通过让读者发现新文章,可以增加博客流量,进而收集到更多的反馈。除了在自己的博客上推荐文章,我们还希望,在别人的博客上也推荐自已的文章。自己推荐自己的,容易,那怎么让别人也推荐自己呢,答案就是互惠互利,我给你推一个,你也给我推一个。

希望在上面挖掘需求的过程中,你一直跟着我,没丢。如果万一没跟上,我总结一下,我们要用这个博客推荐系统,帮助博主们以互惠互利的方式,推广文章,收集读者反馈,提升博主影响力,改善博主们的生活品质。

开发将以何种方式进展

开发,我想以开源的方式展开。因为我尝过开源的甜头。我开发过一个小插件,能帮助博主们提升收录质量和速度。分享过算法题,帮助程序员准备面试。还搭建过Scala算法库,帮助竞技人工智能游戏比赛
这些开源软件,不仅帮助我自己提高了自己的开发水平,而且帮我交了很多新朋友。

基于以上的经验,开源这个推荐系统,我想能有下面几个好处。

其一,增加透明度。对于想参与到这个项目中的朋友来说,不论是想学习的,还是想贡献的,开源代码可以给大家一个互相了解的机会。对于想学习的朋友,我觉得除了理论知识以外,能够真枪真刀的练习,也非常重要。网上已经有很多专家介绍如何开发一个推荐系统,但大多的只是局限于理论,偶尔有提到实战项目的,也都是玩具或者封闭式项目。我把安可推荐系统开源,就是想同大家一起,逐渐的完善这个系统。所以看到代码的时候,如果你觉得弱爆了,请不要惊奇,因为项目尚处于起步阶段,我希望它,在实战的考验下,变得越来越好。

其二,寻找合作者。把这个系统转起来,一个人肯定是没有任何指望的,我们需要合作,特别广泛,特别深层的合作。首先就是写博客的博主们。因为系统的核心设计思想,就是基于博主们互惠互利的合作。只有合作,这个系统才能推荐的更广阔,更对读者的口味,如果你也不推荐,我也不推荐,那么大家都还是关起门来造车子。其次,这个系统还需要热情洋溢的程序员,因为这个系统不是一个几行代码的小插件,从架构上来讲它涉及到了前段,后端,数据库,从算法上来讲,我们会用到推荐算法,虽然初期的会比较简单。最后,我们还需要赞助商,投资人,虽然我可以掏自己腰包养活这个项目(目前预算是一年消耗200美元左右)但如果万一用的人多了,消耗就会变得越来越大,就需要更多的资金,不过这都是后话。

最后,增加信任。把代码,算法全部展现给大家,博主和博主之间可以建立信任,因为他们可以搞明白,文章互推的规则是怎么建立的,互惠互利的合作是怎么进行的。除了博主之间,还可以增强读者和博主之间的信任,因为读者能知道文章是如何推荐出来的,能判别是不是标题党,有没有点击的必要。

结语

希望上面两个事讲的还算清楚,能吸引到你的好奇心,来关注这个项目。最后,就把项目的前端后端代码分享个大家。如果你有反馈,欢迎来这里,或者添加我微信公众号。

近一个月来,博客发生了跳跃性的发展。十一月初,每天有四五十的页面访问量,一个半月后,翻了十倍,平均四五百的访问。在这篇文章里,我首先想说一下这次流量增长给我带来的影响,然后分析增长的原因,最后,展望如何让增长势头保持下去。

翻了十倍有什么影响

首先,多了一种成就感,因为服务了他人。比如说,有一位读者要把“学习如何学习”分享给她的上学的女儿。有人从我的“创业失败的经历”中感受到了创业的激情与艰辛。

此外,增加了自信,因为得到了的赞许。在开发者头条上,“学习如何学习”这篇文章成为了当天的精选文章。还有好心人把它投递到了博客园上,成为了编辑推荐文章。

其次,个人形象的改变。有人通过博客看到了我的代码,比如此代码仓库收获了18颗星,进而加深了我是一个热情洋溢的程序员的形象。还有更多朋友知道了我是一个有创业追求的人,找我聊创业的想法。这些朋友很有可能成为以后的创业合伙人。

最后,还捞到了博客开写的第一桶金,有热心读者通过我的链接在亚马逊上买了一本书,我收获了一块二毛钱的分成,谢谢您。

为什么出现了增长

我觉得有两大原因,一是推广,二是文章之间的关联。

我们技术人员大都不太擅长推广,感觉只要把代码写好就行了,有种酒香不怕巷子深的清高。可我认为,推广是寻求反馈。本章好不好,酒香不香,自己说了不算,别人喝了才算。酒香,又找到了黄金店铺,这多好,要火的节奏。如果酒别人尝了不香,那也很好,负面反馈能帮助我们提升自己,避免在错误的道路上越走越远。

所以必须要走出去,推广!我现在的推广都是手动的,主要是投递文章到极客新闻,SegmentFault,开发者头条(此次十倍增量的大功臣)等等。这种推广方式有很大的偶然性,如果你的文章没有被及时的发现,那么就是泥牛入海,因为像我一样推广的人很多很多。

除了不遗余力的推广之外,此次流量翻倍另一原因,就是文章内链。细心的朋友可以发现,最近的文章结尾部分,有相关文章的连接,引导读者发现更多内容。特别是有一篇好文的时候,这时会出现先让一部分人富起来,然后带动周边穷人发展的效果。

可持续发展

通过以上两部分的讨论,毫无疑问,我会坚定创作决心,因为有那么多正能量。其次就是加大推广力度。如何加大力度?我有一些初级的想法:跨博客相关文章推荐。

跨博客相关文章推荐

用四个字概括,就是礼尚往来。我在我的文章里推荐别人的文章,这叫往;相应的,别人在他的文章里推荐我的,这叫来。礼尚往来,不仅能让我们零成本的推广内容,更能在往来的人之间建立起更多的联系。除了让博客主收益以外,读者朋友们也有了更多发现优质内容的机会。

如何自动化礼尚往来?我们需要一个平台。假设你是一个博客主,你写了一篇文章,想把礼送出去,你可以使用这个平台的相关文章推荐服务,这个平台可以给你推荐一份链接的单子,这其中既有你博客的内链,也有给别人的外链。别人使用这个服务的时候,也会给你的文章发外链,因为我们的宗旨是礼尚往来。

加入我们!

跨博客相关文章推荐,处于初期开发阶段,我在这里这里做了一个调查。非常感谢reuixiy成为首个愿意测试这个想法的朋友。如果你想加入我们,请发邮件hedonplay@gmail.com,或加公众号:王辉的博客。如果你认识写博客的朋友,请转告我们热情的邀请。

Jean-Baptiste Rudelle有两个梦想:创办一家公司,写一本书。他都做到了,公司是风靡法国的Criteo,书叫“他们说这不可能”,讲了Criteo从巴黎的一家沙拉店到纳斯达克上市的经历。

创业我也尝试过,项目获了奖可仍然失败了,这篇文章说说我的经历,和书中的成功经验对比一下,看我学到了什么。

我的不可能

故事从2016年初春开始,我的一个同事加老乡,神秘兮兮的问我,要不要搞点事情。他说团队不错,有美工,有市场,不是程序员单干,但出于保密的要求,他没有告诉我具体做什么。一周以后在法国国家图书馆,我见到了牵头人,大家互相赏识,当场就牵手成功。项目是开发一款绿色的陌生人社交学习应用,帮爱学习的人找到学习的伙伴。

接下来的2016年夏天,美工,程序员,产品经理,视频制作员,大家加班加点的准备“春晖杯”法国分赛区的创业大赛。团队中都是在校学生和在职员工,只能利用晚上和周末的时间赶项目。那个夏天,我几乎不和朋友见面,像消失了一样。付出得到了回报,我们斩获了一等奖,赢得了秋天参加江浙人才交流会的入场券。然而,初战告捷的背后,我们丢失了一员大将,因为项目上无法调和的分歧。

获奖之后,加上人员上的调整,我们度过了一段困难的日子。参赛之前,大伙有目标,有任务,商业计划书要写,应用要上线。可比赛毕竟只是比赛,项目的成功最终还是取决于能不能创造财富。秋天到了,我们从巴黎到了江浙,怀揣着邂逅投资人的愿望。江浙确实举办了一次盛会,可除了参加了几次路演,给领导们的讲话鼓了几次掌,加了几个微信群之外,我们并没有找到愿意陪我们走上一程的投资人。

在徘徊中,又有人离开了团队,这时已经是2016年的冬天。江浙三日游之后,我们意识到必须推广应用,吸引用户,验证模式。没有资金支持,没有充裕时间,我们很难走下去。我完全可以理解,当时任何一个人做出的离开团队的决定,因为人到这时候,只能用身心俱疲来形容。一次接着一次的推广,我们怀着希望出发,载着失望归来。虽然受测用户嘴上说着我们的产品好,却留不下日活。

摸索中,2017到了,春节过后我们说,如果要继续下去,必须拉到投资。就这样,在创业进一年之后,我们第一次触碰到了那个话题:团队的股权结构。一个没有股权结构的团队是拿不到投资的。可一款没有日活用户的应用,拿到投资谈何容易。

2017年的春天,故事从春天开始,到春天结束,失落,迷茫中夹杂着一丝解脱。

他们说这不可能

途中,有人告诉我,你们的项目不可能,到最后我都没有信。Jean-Baptiste Rudelle把Criteo变成了可能,并把它写成了一本书,让我们看看他是怎么做到的。

借力投资人

Jean-Baptiste有两个合伙人:Franck和Romain,走廊里认识的。可在这之前,他先去见了投资人。投资人听完报告后,说要商量一下才能给结果。出门等待的间隙,Jean-Baptiste在走廊里察觉到有两个人的谈话内容和他的想法很像,就去接触了他们,三人最后走在了一起。我这里重点想说的是,在没有产品,合伙人的情况下,Jean-Baptiste首先见的是投资人。而我们是在团队在发展到十多人,参加了比赛,获了奖,上线了产品,申请了专利之后才开始找的投资人。

这其中的一个原因,就是担心前期身价太低,把自己卖的太贱,想等着估值高的是时候再引入资本。没有资金,大家只能兼职硬撑着。这不仅不利于长期工作,而且束缚了产品的迭代速度。

找投资人就像做销售一样,所以能拉来引投资的人是团队中重中之重的人才,Jean-Baptiste并没有像其他两位那样贡献了精妙的算法,但这并不妨碍他是公司的第一大股东。

转型

在初创企业里,有一个专业术语叫Pivot,意思就是当产品行不通的时候,要大胆转型。Criteo起初是因为Jean-Baptiste做完沙拉后看了一部烂电影,想搞个评分系统给人们推荐好看的电影。除了推荐电影外,他们还推荐过博客,一直到今天做实时动态广告的推荐。所以说,起初的点子重要吗?世界上最不缺的就是点子,缺的是能快速转型的团队。Jean-Baptiste在创建Criteo之前已经有过几次创业经历,之前的经历中,当转型的时候,总会遇到阻力,团队认为转型不可能。而在和Frank和Romain的合作中,后面两位可谓转型的好手,两个月就把原来的电影算法转成了博客算法,再到之后的广告算法,都是神速。

我们虽然也调整过几次路线,从最初的学留学知识,到百科知识,一直到最后的星座知识,但基本的模式都没有变,另外就是转型周期过长,我想这和大家兼职,不在一起工作都有关系。

共享成功

21世纪我们能共享什么?我们可以用Airbnb共享房子,用滴滴打车共享车子,用迪拜共享单车,用某某共享雨伞,共享马扎,最近又听到共享娃娃机。共享是一种哲学,在创业的过程中,你还能共享什么?共享成功!Jean-Baptiste最初就认识到,创业不是一个人的事,要吸引人才,就要共享股权。具体数字我不知道,Criteo的初期的几百个员工都拿到了股权。有的创始人害怕失去对企业的控制,不敢把股权放手出去。可凡事都是相互的,你不想别人分了你的蛋糕,那别人就不会全心全意的把蛋糕做大。一个饼干的百分之百还是一个饼干,一个市值上亿的公司,持有百分之一,就可以让你变成百万富翁。

我们的团队,由于股权问题研究的太晚,在很长的一段时间里,大家都不知道各自占了多少,我想这在一定程度上,影响了团队的稳定。

企业家情怀

接下来说的这两条和创业关系不大,Jean-Baptiste讲了点情怀。

富人税

每个人都有他的烦恼,穷的时候想着填饱肚子,富的时候,想着避税。书中的一个桥段,非常形象,说Jean-Baptiste在他的大别墅前,看到了两个人从保时捷跑车里走出来,成功人士的打扮。其中那个女的,很自然的问Jean-Baptiste有没有把收费站的发票留下,能不能把发票给她,这样她可以充做企业开销可以减税。

互联网革命创造了巨大的财富,本以为它会帮助整个社会更上一个台阶,然而财富却掌握在少数人的手里,并没有对社会产生多大影响。我上一年去三番参加JavaOne的时候,就被那么多露宿街头,步履阑珊的流浪汉给惊到了,举世闻名的San Francisco同时出现了天堂和地狱。Jean-Baptiste应该是一个社会主义者,他愿意交更多的税,去降低这个社会的贫富差异。

不需要看价签的时候

在书的最后部分,Jean-Baptiste问了一个问题,当你买东西再也不需要看价签的时候,你会怎么安排余下的生活?当然,我们说的不是买袜子,买肥皂的时候,是当你在巴黎买房子的时候都不在意价钱的时候。这里卖个关子,我不说他的答案了。如果你励志做一个企业家,你可以想一想你的答案!

后话

虽然创业失败了,但我从中受益匪浅。创业本身,无论成败,都是一段宝贵的经历。我结识了那么多有理想,有才华的青年。团队中如今有人去了Amazon,有人去了Criteo,(有谁找工作,我可以帮助找他们内推),还有人把自己的头衔变成了博士。期待再次扬帆启程!

0%