看,你的城市有多懒

标签:数据科学

访客:45035  发表于:2015-07-07 15:51:21

【导读】基于数据科学性基础之上的人性化表达,是这个应用最与众不同的地方。

看,你的城市有多懒

     最近一个称为“Human”的运动管理软件,在社交圈引起了不小的波澜。Human 是一款移动追踪应用,没有硬件,仅通过 iPhone 手机追踪用户的全天运动。但是它可以分类记录你的运动模式,每隔30分钟,它都会悄然记录你是怎么样度过的:是在骑车、走路、跑步或是在健身房,让你对自己全天的运动方式一目了然。
不过和iPhone手机内置程序只记录用户折线图的方式不同,Human都在后台默默运作,从不会主动推送给用户。记录的内容也有所不同,包括了运动的轨迹、运动的时间以及不同方式下估算的消耗的卡路里数量。如果这看起来只是一个用户的普通数据并不为奇,Human惊人地将一座城市用户的运动轨迹用图像表达出来,化作一道道光线,绘制了一份令人叹为观止的“城市运动数据地图”。
    它们选取了全球具有代表性的30座城市,发表了一份全球性的城市居民运动情况报告,看不同的城市中的人群以哪种方式在“运动”,他们的轨迹如何相互发生关联。因为采取了不同的追踪方式,骑车、走路、跑步、健身等数据都被汇总起来,最终组成了四张运动数据地图。城市的某束光线越是密集、明亮的地方,就表示采用这种方式出行的用户人数越多。谁也没有想到,在城市中每一个人的运动轨迹,竟然可以绘就出不一样的城市地图。
     从数据的图像结果来看,最热爱运动的城市都集中在西欧地区,其中荷兰的阿姆斯特丹、德国的柏林以及丹麦的哥本哈根,分别位居运动型城市榜单的前三位。而最不热爱运动的城市则并不意外地出现在了美国加州,洛杉矶不管在骑车人数的比例、步行人数的比例都位居30个城市排行榜垫底,成为“最懒惰的城市”。除了总分排名,Human还根据细分的用户数据,得出了各个运动方式的排名数据,例如华盛顿、柏林、阿姆斯特丹分别荣登最爱步行的城市、最爱跑步的城市和最爱骑车的城市。而巴黎、伦敦、纽约等国际都会城市,虽然没能摘得各个榜单前三名,但是繁忙的城市生活依然没有让市民们忘记良好的运动习惯。
   你该起来动一动了
   开发这个应用的最初目的,据说就是为了让城市里的居民们回到8000年以前的人类生活状态——不是每天对着电脑,坐在一张椅子上,而是能够运动在城市中。
根据Human发布后4个月,开发者提供的官方数据表明,“40% 的使用者在下载Human应用仅仅6周后,运动习惯就在稳步地改变。”“击掌,你刚刚完成每日30分钟!”这条由Human推送的通知,让一些都市的白领们,开始感到30分钟的魔力。在第一次设置完应用程序之后,它就开始转入后台运行,每天不需要打开应用,它总是在运动量达到30、60或者90分钟的时候,推送一条祝贺的通知。通知只停留短短几秒钟,但它就像个耐心的健身教练,在刚刚达成任务目标的时候,继续鼓励你冲刺下一个。
虽然这个原理看起来简单,但是应用程序的开发者、创业团队的首席执行官雷纳多·奥尔默斯(Renato Olmos)认为,基于数据科学性基础之上的人性化表达,才是这个应用最与众不同的地方。这不仅因为这位出生于1985年的年轻企业家,曾拿到过互动设计的硕士学位,而且他曾经是个胖子,最重达到了290斤,而现在的他只有160斤。切身的经历让他更加明白怎样鼓励人们去持续锻炼。
    “并不是靠一堆数据、一些图表,城市白领们就会站起来。”奥尔默斯表示自己曾经尝试过类似的方法,但是最终都失效了。“我们逐渐意识到时间线、详细的图表的作用是非常有限的。因为它根本没有改变用户的行为!尤其给人们看一张按时间线标识的运动轨迹图,一开始是挺棒的,但是过几天之后,就变得乏味了。”
而作为一个“拟人化”的应用,Human做的事情看起来就简单许多——它把复杂的数据记录,隐藏在应用界面巨大的圆环后面,每次呈现给用户的总是最简单直观的一个数字,让实现这一任务变得具体。例如“每天步行30 分钟”的提示语,就给了用户一个非常具体的目标。想象一下,“今天还有 400卡路里需要消耗”和“吃完饭再出去散步 15 分钟”哪句话更容易实施,这种心理上的细微差别,是除了交互设计、功能设置以外,另外一个影响应用使用率的重要因素。Human 看起来被动,但最终在日复一日的鼓励下,能够帮助运动习惯的养成。它看起来像个定时器,但是大量的用户就在这样反复的谆谆教诲之下,变得愈发依赖于它。
   由于有着大量的数据支撑,因此Human在用户的体验上做到非常细致。在App Store刚上线的那周,Human就迎来了第一个10万名用户。现在每周Human至少追踪160万用户的运动情况,这个数字每过去7天,就保持着40%以上的增长率。用户来自超过全球100个国家,从美国本土的夏威夷到非洲的津巴布韦。借助于iOS的地理位置信息,Human拥有了一个非常具有代表性的数据库。而且对于每个用户的追踪质量,在时间周期上也具有完整性,数据非常可靠且实用:每次追踪的活动时间至少达到48小时,追踪的总时间不少于6周。
   用户对于这个应用程序的反馈也非常积极,不仅在App Store上给出了4.8分的好评,在实际行为上也发生着转变。不仅每天活动时间达到30分钟的用户数量上升,而且户外运动的实际时间也在显著增加。Human给出的数据显示,他们从每天的平均运动20分钟增加到了约30分钟,这个数字非常接近于Human所设定的目标。尤其到了第六周以后,Human发现用户的平均活动时长已经可以达到68分钟,这个增长是令人兴奋的。
    Human还有很多激励的招数:用户可以实时导出自己的数据,看到更加直观的图表,还能上传到云端进行存储和对比。至于你担心的隐私问题,奥尔默斯表示这些数据都可以被导出,然后一键彻底删除保留在手机和服务器上的记录。你还可以建立Human俱乐部,通过名字或E-mail邀请朋友、家人或是同事一同加入,在你灰心丧气的时候,让小伙伴一起鼓励你。每个用户最多可以建立3个俱乐部,每个俱乐部上限10人,互相分享最新的运动进展。
    城市运动地图的像素
    如果说Human激活了用户的运动习惯,它也正在用看起来不可能的方法,从激活整个城市的运动“细胞”,到激活整条“神经系统”。
    奥尔默斯介绍了“世界运动数据地图”的产生缘由和过程。在2013年9月应用程序上线后不久,就收集到5500万条活动数据,数据增长的速度非常惊人,而Human团队深信其中含有巨大的价值——世界各地不同的用户在使用Human上的方式到底存在哪些差异,这些差异背后又反映了哪些更深层的原因?
奥尔默斯坦诚,这来自于网络铺天盖地的数据可视化趋势。尤其是另一个知名运动软件Endomondo的首席数据分析师巴斯科夫(Nikita Barsukov)率先开展的运动数据地图式分析,以及由Flowing Data的数据分析师纳森·姚(Nathan Yau)给出的美丽杰作,给了Human在数据可视化上丰富的灵感。
在架构搭建上,Human没有依赖自己的服务器,而完全依靠亚马逊云服务器,运用MySQL数据库储存海量的用户活动数据。截至目前,Human已经产生的就有超过1000万兆的数据,其中既包括了位置数据,也包含了运动数据。通过GPS数据的筛选,Human首先缩窄了数据范围,并将其转化为CSV数据格式,通过Phyton程序将关联的数据进行合并,每分钟处理的CSV文件数量达到数千份。为了保证数据的信度和效度,Human尽可能多地保留了原始数据,据统计,最后导出的数据采样点达到了6500万个。团队成员把所有的采样点按照城市分类,形成30个城市各自独立的庞大数据库。
Human将用于统计分析、绘图、数据挖掘的工具设定为了R语言。最早开展的一组实验是荷兰的阿姆斯特丹,通过与Google地图的比对,证实了Human软件所获得的数据的丰富性,有的街道超过90%的区域都被GPS数据定位信息所覆盖,只剩下不到10%的空白点。面对如此海量的数据,经过不断的试错和尝试,Human放弃了如Endomondo那样的“物理地图比对”的最初设想,而开始尝试把人的运动轨迹作为地图。换句话说,人就是组成这幅城市运动数据地图的单个像素,他们的集合构成了这座城市或明亮、或黯淡的运动轨迹。
因为运动轨迹本身就是动态的,Human发现用静止的图像很难去真正描绘市民运动的情况。如何才能让一天24小时的状态变化,用一种运动着的方式去表达,成为了困扰Human团队的技术难题——他们的解决方案是采用视频。就在此时,亚马逊EC2平台上的Rstudio让他们有了更加纯熟的大数据处理能力,几乎不到半个小时就可以处理完成一次运算。
以完成30秒、24帧每秒的短视频为例,共需要产生720帧的画面。团队成员再次对数据进行深度挖掘,利用数据采集点上的时间戳,对数据产生的时间进行了再度分类,最后形成了每座城市780帧的图像。基于这些图像,让这些城市的运动状态立刻变得“鲜活”起来。整个制作过程中,Human团队并没有使用到Photoshop进行美化,完全依赖Sketch进行视觉设计,奥尔默斯认为展现运动轨迹的美,在于让复杂的线条简化,只用对比度说话。当黑色的背景上,白色的光带出现时,就好像沉沉夜色中,闪烁飞过的萤火虫编队。
由于留给Human团队的时间并不充裕,他们要忙于应用的更新维护,还要同时兼顾数据的分析发布。最终,他们保留了最具有Human特色的核心数据和可视化图像,只保留最能反映一个城市在24小时中运动变迁过程的数据。令人难以置信的是,从数据导出、集中开始,学习R语言的使用,再到找出图像可视化的最佳方案、进行视频制作,他们只花了10天时间,就得到了在互联网上轰动的“30城运动数据地图”。从Business Insider, Engadget到The Next Lab, Citylab几乎超过200家互联网媒体进行了第一时间的报道,上线第一周Vimeo上就有超过55000名用户,围观了哪座城市的市民,在我们这座星球上“最懒”。
     让人咋舌的数据结果   
   在报告中,相对其他城市平均50%的机动车依赖率,洛杉矶的机动车依赖率高达74%位居第一,而最热爱运动的城市阿姆斯特丹的机动车出行率仅有24%。除了出行基本靠汽车,洛杉矶在三个单项排行榜上也都排名垫底,步行率只有20%,骑车率4%,跑步的只有2%。
洛杉矶是世界上第一个以主动迎接机动化所设计的城市,无限制向外扩张的城市,停车场和道路设施占到城市面积1/3,但悖论的是,它的交通堵塞却是全世界最严重的,平均堵车的时间超过了72小时。或许,洛杉矶人把运动的时间,都花在了漫长的道路通行上和无止境的堵车上。
这样的堵车还带来了健康威胁。1943年、1955年、1970年接踵发生的洛杉矶光化学烟雾事件就是最好的例证,洛杉矶的市民中有3/4患病,数百人因五官中毒、呼吸衰竭而死。而很多城市事实上都在拷贝着世界上最糟糕的城市发展模式——洛杉矶,星星点点的跑步记录和密集明亮的机动车记录形成鲜明对比。
Human统计的数据显示,美国的迈阿密、休斯敦、波特兰也都选择了“以车代步”的城市发展模式,机动车依赖率超过60%,在选择步行、跑步、自行车作为日常出行模式上,排名倒数。尤其值得一提的是,波特兰作为世界著名运动品牌“耐克”的发源地,并没有真正成为领导世界运动的先锋城市,与之形成鲜明对比的是,其热爱跑步的市民比例在30座城市中排名倒数第一,甚至不足2%,让一些美国人也大跌眼镜。
相反,华盛顿、纽约、旧金山等经济更为发达的城市,已经将运动作为一种风尚。华盛顿是美国最热爱运动的城市,那里的市民最喜欢步行。纽约每天自发或被动地在跑步的人数远超华盛顿。而旧金山则真正地在生活中找到运动的乐趣,自行车骑行的比例达到10%,位居第五位,仅次于阿姆斯特丹、哥本哈根、里约热内卢和柏林。
西欧国家一直以来是环保和健康生活的积极倡导者,统计数据的结论,也在刷新我们过去陈旧的观念。阿姆斯特丹以自行车文化而驰名世界,但是从运动轨迹的角度来看,这座城市自行车流量所覆盖到的区域,只占非常小的一部分,远不及伦敦。不过从人口的比例上来说,76%的阿姆斯特丹居民都热爱骑自行车。在“最运动城市”阿姆斯特丹,自行车地图的明亮程度远超机动车,依然无愧“自行车之都”的称号。丹麦的哥本哈根也在迅速追赶,成为用自行车出行的主要城市。荷兰、丹麦已经当仁不让地成为自行车王国。
如果从跑步的角度看,作为排名第二的“最运动城市”,柏林人最爱跑步健身。甚至有人说:要看德国人精确、一板一眼的民族性,最好的角度是参加一场马拉松,即便几岁的小孩都会在家长的鼓励下报名参与。香港也成为了亚洲城市中的亮点,以接近6%的比例位居单项第二。在这寸土寸金、高低起伏的土地上,跑步或许是比骑车更实际的健身方式。
除了世界30座主要城市的运动模式,现在Human正在研究的还有,冬季对于人类活动的影响。好比美国东海岸在2015年1月和2月期间刚遭受的百年一遇的严寒袭击,Human正从190万用户的活动数据中寻找新的亮点。在运动大数据的背后,原来藏着太多的奥秘。
-----------------------------
本文系IT经理世界/经理+原创,作者:陈婧,转载请注明出处和作者名

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");