• 机器学习
    高速发展的机器学习,会给企业运营带来怎样的改变? 来源:猎云网(微信号:ilieyun)  编译:Mancy   毫无疑问机器学习正处于 hype curve (发展规律周期)模型的顶峰位置。当然,反响也异常激烈,仅在过去一周我就听了 20 遍这样的笑谈:机器学习就像青少年的情欲,人人都在谈论它,但是没有人真正了解它。但就在我身处的地方,有人运营了一家公司,让现实世界中大量的机器学习项目都变得可以施行,很明显,机器学习将极大程度地改变公司的运营方式。   它并非只应用于 Siri 和 Amazon Echo 这样新潮的产品,它的研发公司也不局限于我们通常认为的拥有大量研发预算的谷歌和微软。在现实中我敢打赌,几乎所有的 500 强公司都因使用了机器学习而获得了更高的效率和利益。所以机器学习身在何方呢?在这里我们介绍几款能让生活变得更美好的幕后应用。   赋予用户生成内容以价值 一般的用户生成内容有点吓人,实际可能比你想象的还要糟糕,这些内容充斥着错别字、低俗内容和完完全全的错误信息。机器学习模型可以确定用户生成内容的好坏,筛除糟糕的内容,让优秀的内容展示给别人,而这些过程都无需人工审核。   与之类似的情况还有垃圾邮件。还记得那些关于垃圾邮件的辛酸往事么?机器学习可以帮助确定哪些是垃圾邮件,而且基本上可以过滤它们。近些天,清晨检查收件箱时你会发现垃圾邮件日渐减少。希望在不远的将来用户生成内容也能达到这样的效果。   Pinterest 利用机器学习向人们展现了更多有趣的内容;Yelp 用机器学习整理用户上传的照片;NextDoor 用机器学习筛查留言板上的内容;Disqus 用机器学习来剔除垃圾评论。   更快发现产品 作为一家搜索公司,谷歌总是最先聘请机器学习的研究人员,这不足为奇。实际上,谷歌近期分配了一名人工智能专家负责搜索。但是,自 1970 年开始,搜索大型数据库和匹配关键字抓取结果的技术就已存在。谷歌的特别之处就是它知道哪一个匹配结果具有最大的相关性,而谷歌具备该能力的原因就是它使用了机器学习。   但是,不仅仅只有谷歌需要智能的搜索结果。家得宝也需要在巨大的货物目录中为某位客户不规则的浴室匹配合适的浴缸。苹果公司需要在其应用商店中展示相关应用。Intuit 需要在用户提交某一纳税申报表格时给出相应的帮助页面。   像 Lyst 和 Trunk Archive 等成功的电子商务初创公司都使用机器学习为自身的用户提供高质量的内容。其他初创公司如 Rich Relevance 和 Edgecase 会采用机器学习的策略,当商务客户浏览产品时,公司会将机器学习所获得的益处展现给他们看。   与客户打交道 你可能会注意到,近些年来,“联系我们”的形式变得更加稀少。那是机器学习简化了业务流程的另一表现。为了不让用户自行选择问题,不停地填写问题表格,机器学习会查看请求内容并将其导向合适的地方。大公司愿意在机器学习方面投资,因为他们已经看到了机器学习正向的投资回报率。   理解客户行为 机器学习亦擅长情感分析。对于不搞市场营销的人而言,舆论有时候是暧昧不清的东西,也会推动许多重大的决定。例如,一个电影工作室推出了某一暑期大片的预告片,他们可以通过获取社会的反响来看看目标观众的呼声在哪里,然后他们就会调整广告策略来让真正感兴趣的观众浮出水面。这样,工作室就不动声色地把观众带进了电影院。   另一个例子就是:一个游戏工作室近期在某款流行电子游戏的主线中推出了新的主题,然而当中却没有玩家期待的某个游戏模式。当玩家通过社交媒体开始吐槽时,工作室就能监测这些言论,找出自身的问题。然后,工作室会暂停他们的发布计划,等添加了新的功能之后他们就能把黑粉转为真爱粉了。他们是怎么从数百万的 tweet 中发现这些微弱的声音的呢?答案就是他们使用了机器学习。在过去几年中,通过机器学习监听社交媒体已成为标准的运营程序。   下一步? 处理机器学习算法是个很棘手的事情。正常的算法都是可预测的,我们可以透过现象看本质,理解它们是如何工作的。在某种程度上,机器学习更像人类。作为用户,我们有时候想不通纽约时报为什么会推送那些奇怪的广告,也不明白亚马逊为什么会推荐那些滑稽的书籍。实际上,纽约时报和亚马逊不能像人脑一样明白那些特定的结果,例如我们知道为什么晚餐选泰国菜,然而它们却不知道。   如果十年前你步入了机器学习的领域,除了谷歌和雅虎之外你可能找不到工作。而今天,机器学习无所不在。数据比起以往更为普遍,也更易获取。例如 Microsoft Azure ML 和 IBM Watson 的新产品降低了先进机器学习算法的准备成本和持续成本。   大众文化中的机器学习主要集中在人工智能的私人助手和自动驾驶汽车上,不过几乎你打开的每一个网站背后都有机器学习的支持,大公司投资机器学习并非因为它的流行或者先进性,而是机器学习能给他们带来可观的投资回报,这也是创新不断产生的原因。
    机器学习
    2016年03月31日
  • 机器学习
    云+机器学习=? 周六,亚马逊宣布AWS将新增机器学习服务,这项服务“面向没有经验的开发者,可以完全托管”。提交至该服务的所有数据都将保密,而随着客户向其中输入更多数据,这一系统将越来越智能。   过去的多年里,机器学习技术一直在亚马逊公司内部使用,主要被用于亚马逊商城的个性化推荐。但AWS的一些大客户,包括社会活动网站Change.org,要求亚马逊提供更多的机器学习支持。   对于大多数企业,包括中小型互联网企业和几乎所有的传统企业,它们不具备自己搭建云平台的能力和优势。云就像电网集中供电一样,通过网络从hub向分支传输资源和能力。每个企业自己进行数据存储、计算、分析,就像自己用发电机发电一样,不会是主流现象。   在亚马逊之前,其他巨头也在尝试将云和机器学习结合起来,微软推出Azure云机器学习平台,谷歌则允许Prediction API接入谷歌云。   《纽约时报》评论道,微软、谷歌、亚马逊谁会成为最大的赢家,这不是最重要的,最重要的是,亚马逊拉低了云机器学习的价格和门槛。我们离一个低成本预测的时代更近了,而这里说的预测,不局限于预测购物行为、观影喜好等等,而是全面渗入整个世界:基因组学,物联网,大型网络软件,企业决策……   当然,就像电厂故障会带来巨大的经济损失一样,随着云平台承载了越来越多的任务,安全性和可靠性被摆在了更重要的位置。哪家公司都不想像Netflix一样,因为AWS数据中心故障,用户无法正常观看视频。   云服务是否能赢得足够的信任和认可,除了本身的政府的行动对此有很大影响。去年,6亿美金的CIA大单最终花落AWS。老顽固CIA的认可,是对AWS可靠度和影响力的有力背书。而在我国,去年工信部出台可信云认证,试图指出一条透明的云服务之路。   来源:36氪  作者:胡卷卷   扫一扫,关注“HRTechChina",聆听人力资源科技的声音!
    机器学习
    2015年04月13日
  • 机器学习
    大数据+机器学习+平台,Dato拿了1850万美元B轮融资 大数据在硅谷炙手可热,拿融资自然也不再话下,拿到千万级美元融资的也有不少,不久前大数据分析云服务GoodData就获得了Intel Capital领投的2750万美元。据华尔街日报消息,机器学习平台 GraphLab 刚刚改名Dato,并获得了 1850 万美元新融资,投资方为 Vulcan Capital 、Opus Capital 、New Enterprise Associates、Madrona Venture Group。此前他们曾获得680万美元融资。   GraphLab 提供了一个完整的平台,让客户能够使用可扩展的机器学习系统进行大数据分析。简单来说,就是从别的应用程序或者服务中抓取数据,让机器学习这个模型,并将学到的知识作为基础,自动地进行准确的预测和决策制定。这么讲挺抽象,我们还是具体举几个例子吧。可能最好理解的就是民主国家政府的民意调查,可以通过社交网络、媒体等提取数据,分析出民众到底在关心什么,分析出哪些区域的哪些问题必须关注、解决。其实,生物医学研究团队也会使用 GraphLab,主要是来分析临床记录,从而预测病人的病情发展趋势。零售业可以做价格预测、用户推荐;金融服务业可以做诈骗预警;市场公司则可以通过情绪分析锁定关键客户。现在 GraphLab 的客户已经包括 Zillow、Adobe、Zynga、Pandora 等。   那为什么是 GraphLab(现在应该叫 Dato 了)会获得这么多客户的青睐呢? 其实,将原始数据转化为决策依据,并作出预测,这个过程还是很复杂的。往往需要大量的数据处理工具,收集、清洗数据,再建模分析,得出结论,进行展示;还需要大量的数据科学家或同样知识渊博的软件工程师来配合完成。既耗时费力,还投入不菲。所以 GraphLab 这样的平台,可以让毫无编程经验的数据科学家,快速地将理念转化为生产环境可以使用的产品,提高企业的生产效率,自然受欢迎。值得一提的是,Dato 现在能处理各种数据类型。     GraphLab 的创始人 Carlos Guestrin 是机器学习界国际公认的大牛,曾被 Popular Science 杂志评为 2008 年 “Brilliant 10”,还获得过美国青年科学家总统奖。2008 年在卡耐基梅隆大学带着两个学生研发了 GraphLab 的原型,2012 年被 Jeff Bezos 游说去了华盛顿大学。   在 Madrona Ventures 和 NEA 的资金支持下,2014 年 3 月创办了 GraphLab,并以测试版的形式推出了第一个商业版。2013 年 10 月,增加了机器学习功能,推出了新版本。现在的 GraphLab 已经不仅仅是图谱分析了,更是一家基于 AI 的大数据公司,能够处理各种数据类型,所以公司也改名叫 Dato 了。   在美国现在的大数据公司主要有四类:   数据的拥有者、数据源:特点是业务优势能收集到大量数据,就像煤老板垄断一个地区的矿一样。其实大多数有能力产生或收集数据的公司都属于这类型,比如Vantage Sports和收集了PB级数据的包子铺。   大数据咨询:特点是非常技术,提供从基础设施规划建设维护到软件开发和数据分析等的服务,但不拥有数据,比如Cloudera这家不到500人的startup是最著名的Hadoop架构咨询公司。   做大数据工具的:比如AMPLab出来的Databricks和Yahoo人主导的Hortonworks。   整合应用型:特点是收集拥有或购买一些数据,然后结合AI来解决更多实际的痛点。   像 Dato 这种做整合应用型的大数据公司才有可能有希望。未来是 AI 的,而 AI 的食物是数据。就像很多产业链一样,最困难且最有价值的创新往往发生在接近最终用户的那端,比如 iPhone。大数据行业最有价值的部分在于如何利用机器去处理数据得到洞见,影响组织和个人的行为,从而改变世界。收集和整理数据在未来会变得标准化和自动化,而利用 AI 进行分析的能力会变得更为关键。   [36氪,作者: 小石头]
    机器学习
    2015年01月09日