西雅图facebook分部图片(facebook发图)

美国都有那些大的比较有名的公司?

1、苹果公司:

由史蒂夫·乔布斯、斯蒂夫·沃兹尼亚克和罗·韦恩(Ron Wayne)等人于1976年4月1日创立,并命名为美国苹果电脑公司(Apple Computer Inc. ),2007年1月9日更名为苹果公司,总部位于加利福尼亚州的库比蒂诺。

2、Facebook:

总部位于美国加利福尼亚州门洛帕克。2012年3月6日发布Windows版桌面聊天软件Facebook Messenger,从2006年9月到2007年9月间,该网站在全美网站中的排名由第60名上升至第7名。

同时Facebook是美国排名第一的照片分享站点,每天上载八百五十万张照片。2010年世界品牌500强:Facebook超微软居第一。

3、微软:

一家美国跨国科技公司,也是世界PC(Personal Computer,个人计算机)软件开发的先导,由比尔·盖茨与保罗·艾伦创办于1975年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。

4、谷歌:

由拉里·佩奇和谢尔盖·布林共同创建,被公认为全球最大的搜索引擎公司。 [1]  谷歌是一家位于美国的跨国科技企业,业务包括互联网搜索、云计算、广告技术等,同时开发并提供大量基于互联网的产品与服务,其主要利润来自于AdWords等广告服务。

5、亚马逊:

位于华盛顿州的西雅图。是网络上最早开始经营电子商务的公司之一,亚马逊成立于1995年,一开始只经营网络的书籍销售业务,现在则扩及了范围相当广的其他产品,已成为全球商品品种最多的网上零售商和全球第二大互联网企业。

顶级富豪炒房经:硅谷大佬忙囤地 巴菲特看好迪拜楼市

买房才是正经事。

摊开《福布斯》财富排行榜,位列第六的正是83岁的阿曼西奥·奥特加(Amancio Ortega)——西班牙快时尚巨头Zara母公司Inditex集团的掌门人。在刚过去不久的11月,他以近3.76亿欧元的价格买下了一栋位于美国西雅图的办公大楼,Zara的艰难转型丝毫不影响这位世界级炒房者的步伐。

从2001年Inditex集团上市起,奥特加已开始有目的地利用股份分红进行房底产现金,并为此创办地产投资公司Pontegadea,截至2018年底,奥特加的房地产投资的价值总额已达到97.67亿欧元。曾被他扔进购物车的著名商品包括Facebook的第二总部和亚马逊的西雅图总部所在的大楼,同时还有位于西班牙巴塞罗那、瓦伦西亚,以及法国巴黎的苹果旗舰店等。去年全年, Pontegadea的租金收入高达3.62亿欧元,其中51%来自欧洲,46%来自美国,3%来自亚洲。

除了这位服装行业富豪,大洋彼岸的硅谷新贵们也难以抵抗固定资产的诱惑,甚至是老牌投资者巴菲特也在今年表示过进军迪拜楼市的意愿,尽管全球经济增速放缓,但富豪炒房团的热情并未退散。

1

加州炒房团

尽管硅谷科技名声在外,囤地仍是一个公司发展的重要选项。

去年苹果公司发布的年度Form 10-K报告显示,截至2018年底,苹果已经拥有约30平方千米英亩的土地,而在2011年这一数字仅为2平方千米。

相比起租赁,苹果更倾向于直接买下土地。在远离硅谷的爱荷华州,内华达州和北卡罗来纳州等州,苹果已经投入了数十亿美元建设数据中心,用以设立 iMessage、App Store、Apple Music 或 iCloud 的服务器群。

无独有偶,今年年初,谷歌CEO桑达尔·皮查伊(Sundar Pichai)表示今年计划斥资至少130亿美元,在全美14个州建造新的数据中心和办公室,并拓展已有的几处核心办公场所,预计共将创造上万个建筑业工作。

在此基础上,谷歌可以将业务拓展至内华达州、俄亥俄州、德克萨斯州和内布拉斯加州。

今年7月份,澳大利亚建筑公司LendLease宣布已获得谷歌的一项合同,在美国加州联合开发价值150亿美元的房地产项目。LendLease表示,双方将共同承担旧金山湾区三个主要区域的总体规划、土地开发权和发展。

作为科技资本的驻地,加州也是美国400富豪榜上人数最多的州,2019年榜单显示,99位加州亿万富翁的财富总额为6909亿美元,创下历史纪录。尽管多元化的产业不断推动着经济的高速增长,但科技巨头的林立也同时推升着房价,这也催生了airbnb这家房屋租赁公司。2008年该公司诞生之时,旧金山一套公寓的平均月租金尚为2368美元,而今已攀升86%,达到了4404美元。

房屋租赁的灵感还激发了千禧一代的年轻富豪们。今年“科威国际不动产”机构发布的“全球奢侈品和财富引擎”报告指出,这些年轻人几乎一半都集中在加州,占比高达44%,目前,有93%的千禧一代百万富翁的净资产在100万美元至250万美元之间,有将近60%的千禧一代百万富翁居住在加州或纽约州,他们在房地产方面的投资还超过了较为年长的百万富翁——前者的投资组合平均为140万美元,后者为91万9000美元。

报告还指出,这些年轻富豪们很重视房屋所有权,并认为从长远来看,房地产是财富积累的关键。甚至连二十多岁的年轻百万富翁都知道他们的生活将会改变,他们可能只打算在自己的房产中居住两到三年,然后转换为出租物业。

2

巴菲特看好迪拜

瑞士信贷银行研究院发布的《2018年全球财富报告》指出,与2017年相比,2018年全球高净值人士财产构成中,只有房地产投资有所增加,增幅2.8%。

房子的诱惑,连信奉价值投资的股神也未能免俗。

在今年伯克希尔·哈撒韦(Berkshire Hathaway)的股东大会过后,其地产子公司宣布,计划在阿联酋的迪拜开设办事处,将经纪业务扩展到中东市场——“迪拜一直是我们全球网络扩张的重点,它是全球领先创新的代表,也是全球的贸易、物流、旅游和金融中心。”

迪拜房产交易门户网站Bayut数据显示,阿联酋房价在2014年最高时曾超过1900迪拉姆/每平方英尺(约合1.95万人民币/每平米),此后便跌落谷底,今年2月,标普评级称,由于供给持续高于需求,迪拜住宅价格今年还将下跌5-10%,预计在2020年见底。

凯捷管理顾问公司发布的《世界财富报告》亦称,在吸引二套房产投资方面,迪拜在中东地区排名第一,全球排名第四,仅次于纽约、伦敦和香港。

这也引起了巴菲特的兴趣。Berkshire Hathaway HomeServices Gulf Properties首席执行官Phil Sheridan表示,在迪拜房价连跌数年后,许多高净值的客户开始认为,迪拜房地产市场具备不凡价值。

2019年8月,总部位于阿联酋的IBC GROUP周三宣布,计划在迪拜收购1万套房产,用于装修和管理度假屋。

该公司表示,它已与Berkshire Hathaway签订独家协议,将在海湾地区的房产服务中扮演顾问经纪角色,协助房产的确定、收购和融资。该协议中交易价值50亿美元,有可能扩展到在全球100多个城市收购100万套房产。

3

是非成败

大佬们对楼市的热衷也带来了诸多社会问题。

以旧金山为例,在独角兽纷纷兴起之时,贫富分化也愈发严重,随着房价暴涨,无家可归者只能睡在温暖的蒸汽通风口上——在旧金山, 一个四口之家每年收入117400美元在旧金山被归入低收入群体,而每天晚上大约有7500人在这座城市里流浪。

原住民将矛头指向了这些硅谷新贵们,后者也作出了妥协。

今年6月,谷歌CEO桑达尔·皮查伊发文称将在美国大湾区圣何塞市投资10亿美元20000套住宅,该计划并不是针对自家员工的福利房,而是一个让湾区中低收入群体有房可住的经济适用房项目。

Facebook在硅谷投入1800多万美元用于经济适用和多用途住房建设。CEO扎克伯格妻子的陈·扎克伯格基金会也与其他机构共同创建了一项5亿美元的新基金,计划未来5年至10年内,在湾区5个县建造或翻修超过8000套保障性住房。

苹果则宣布了一项25亿美元的计划,包括10亿美元的保障性住房投资基金,10亿美元的首次购房者抵押贷款援助,以及开放一些价值3亿美元的苹果自有土地用于开发。剩下的2亿美元则将用于旧金山住房基金和支持弱势群体。

不过,在苹果计划宣布的第二天,佛蒙特州参议员、2020年总统候选人伯尼·桑德斯(Bernie Sanders)提出了抨击,认为苹果不会解决日益严重的加州住房危机,只会增加其房地产投资——“苹果公司宣布将进入房地产贷款业务,这是为了分散它帮助制造了加州住房危机的注意力,同时又获得了8亿美元的纳税人补贴,并保持了四分之一的境外收入,以避免支付数十亿美元的税款。”

当然,热衷买房的也不乏翻车案例,例如今年上演了IPO闹剧的Wework。

在穿着科技公司外套野蛮扩张数年后,前CEO诺伊曼为自己的疯狂付出了代价。在此期间,他至少购买了五栋豪宅,包括一栋价值1,050万美元的联排别墅;2017年,他又斥资3500万美元在曼哈顿一栋建筑中购买了四套公寓。

当人们认真审视那份招股说明书时才发觉,诺伊曼拥有的WeWork租赁的四座建筑物的所有权,而这些房子则是他以极低的利率向公司借钱买的。

同样是将自己的物业租给公司,诺伊曼却远没有奥特加做得那样滴水不漏——Inditex旗下的品牌便是奥特加的最大租户,他收起租金来毫不手软,虽然外界曾经质疑Inditex是否故意支付了高于市场价的租金,来变相帮助Pontegadea获得更多收益,但他租给包括HM在内的竞争对手时价格也是一视同仁。

全球十大IT企业的总部大楼一览

1、苹果总部大楼

苹果市值9227亿美元,总部位于美国加利福尼亚州的库比蒂诺,新建成的总部酷似太空飞船,耗时8年时间完工,总花费达50亿美元,是全球最有名最有 科技 感的办公大楼。

2、微软总部大楼

微软市值9157亿美元,总部位于美国华盛顿州雷德蒙德市,整体楼层都不高,但绿化环境做得非常不错,曲径通幽。

3、亚马逊总部大楼

亚马逊市值8934亿美元,总部位于美国华盛顿州的西雅图,其新总部花了40亿美金打造的三个玻璃球办公环境,号称把热带雨林搬了进来,整个园区占地30万平方米,除了林立的写字楼和一个可容纳2000人的会议厅外,最核心的部分就是这三个球。

4、google总部大楼

google市值8459亿美元,其总部位于美国加利福尼亚硅谷的山景城,不仅办公环境舒适、环保、 健康 ,处处亲近自然,还塑造了独特的企业形象。

5、facebook总部大楼

facebook市值5023亿美元,总部位于加州门罗帕克,占地面积23.1万平方米,总造价2.5亿美元。从工作交流区到健身房,从免费食品到开放式吧台,提供着着各种全面的设施与服务。

6、阿里巴巴总部大楼

阿里巴巴市值4693亿美元,位于中国杭州的总部大楼Z字型大楼也同样创意十足!

7、腾讯总部大楼

腾讯市值4579亿美元,其总部腾讯大厦高193米。另一座大楼腾讯滨海大厦高248米。看来腾讯对高楼情有独钟。

8、华为总部大楼

华为公司虽然没有上市,如果上市估值应该在4000亿美元左右。总部位于中国广东省深圳市龙岗区。

9、三星电子总部大楼

三星市值2563亿美元,总部位于韩国京畿道城南市盆唐区书岘洞,是韩国最大的跨国企业集团。

10、思科总部大楼

思科市值2427亿美元,总部位于美国加利福尼亚州圣何塞,是全球领先的网络解决方案供应商。 Cisco的名字取自San Francisco(旧金山)

世界首富排名榜!

世界首富排名榜:杰夫•贝佐斯、比尔·盖茨、伯纳德·阿诺特、伯纳德·阿诺特、马克·扎克伯格。

1、杰夫贝佐斯

富豪榜前十名中有7位来自美国。史蒂夫·鲍尔默、阿曼西奥·奥特加和伯纳德·阿诺特财富都增加了200多亿美元。前十名财富总和占全榜单总财富的9%,超过6.7万亿人民币。

因为与前妻麦肯齐达成了“史上最贵”离婚协议,亚马逊56岁的杰夫贝佐斯的财富下降5%,但仍以9800亿人民币的身家占据富豪榜首位,连续第三年成为全球首富。其前妻麦肯齐以3080亿人民币首次上榜,排在第22位。

2、比尔·盖茨

比尔·盖茨已经退休多年,直到去年才被杰夫·贝佐斯夺走了世界首富的位置。目前比尔·盖茨仅持有3%不到的微软股票,截止2018年3月7日,微软市值为7227.03亿美元,每股价格为93.86亿美元。除此外比尔·盖茨的各种投资回报是其财富的能长期排名世界前列的主要原因。

3、沃伦·巴菲特

1930年8月30日出生于美国内布拉斯加州奥马哈市,1951年毕业于哥伦比亚大学。1957年开始进入投资界,他独到的眼光帮助他一次又一次的投资成功,因此被人们称为“股神”。

而他的伯克希尔·哈撒韦公司的也是股界中的传奇,1963年收购这家公司时每股价格为8美元,2017年到达了近30万美元一股,创造了历史纪录。

4、伯纳德·阿诺特

伯纳德·阿诺特是法国首富,他被誉为奢侈品教父,是LVMH集团的掌门人,旗下包括了Dior、LV等世界著名的奢侈品牌。2020年4月6日,伯纳德·阿诺特以5500亿元人民币财富名列《胡润全球百强企业家》第4位。2020年4月7日,贝尔纳·阿尔诺以760亿美元财富位列《2020福布斯全球亿万富豪榜》第3位。

5、马克·扎克伯格

马克·扎克伯格1984年05月14日生于美国纽约州白原市,是Facebook的创始人以及CEO,这个网站是他在哈佛大学二年级时创建的,他也因此成为了世界上最年轻的亿万富豪,随后辍学专心经营公司。

目前他持有约17%的Facebook股票,截止2018年1月8日,Facebook市值为5429。48亿美元,每股价格为186.85美元。

推荐算法简介

写在最前面:本文内容主要来自于书籍《推荐系统实践》和《推荐系统与深度学习》。

推荐系统是目前互联网世界最常见的智能产品形式。从电子商务、音乐视频网站,到作为互联网经济支柱的在线广告和新颖的在线应用推荐,到处都有推荐系统的身影。推荐算法是推荐系统的核心,其本质是通过一定的方式将用户和物品联系起来,而不同的推荐系统利用了不同的方式。

推荐系统的主要功能是以个性化的方式帮助用户从极大的搜索空间中快速找到感兴趣的对象。因此,目前所用的推荐系统多为个性化推荐系统。个性化推荐的成功应用需要两个条件:

在推荐系统的众多算法中,基于协同的推荐和基于内容的推荐在实践中得到了最广泛的应用。本文也将从这两种算法开始,结合时间、地点上下文环境以及社交环境,对常见的推荐算法做一个简单的介绍。

基于内容的算法的本质是对物品内容进行分析,从中提取特征,然后基于用户对何种特征感兴趣来推荐含有用户感兴趣特征的物品。因此,基于内容的推荐算法有两个最基本的要求:

下面我们以一个简单的电影推荐来介绍基于内容的推荐算法。

现在有两个用户A、B和他们看过的电影以及打分情况如下:

其中问好(?)表示用户未看过。用户A对《银河护卫队 》《变形金刚》《星际迷航》三部科幻电影都有评分,平均分为 4 .7 分 ( (5+4+5 ) / 3=4.7 );对《三生三世》《美人鱼》《北京遇上西雅图》三部爱情电影评分平均分为 2.3 分 ( ( 3十2+2 ) /3=2.3 )。现在需要给A推荐电影,很明显A更倾向于科幻电影,因此推荐系统会给A推荐独立日。而对于用户B,通过简单的计算我们可以知道更喜欢爱情电影,因此给其推荐《三生三世》。当然,在实际推荐系统中,预测打分比这更加复杂些,但是其原理是一样的。

现在,我们可以将基于内容的推荐归纳为以下四个步骤:

通过上面四步就能快速构建一个简单的推荐系统。基于内容的推荐系统通常简单有效,可解释性好,没有物品冷启动问题。但他也有两个明显的缺点:

最后,顺便提一下特征提取方法:对于某些特征较为明确的物品,一般可以直接对其打标签,如电影类别。而对于文本类别的特征,则主要是其主题情感等,则些可以通过tf-idf或LDA等方法得到。

基于协同的算法在很多地方也叫基于邻域的算法,主要可分为两种:基于用户的协同算法和基于物品的协同算法。

啤酒和尿布的故事在数据挖掘领域十分有名,该故事讲述了美国沃尔玛超市统计发现啤酒和尿布一起被购买的次数非常多,因此将啤酒和尿布摆在了一起,最后啤酒和尿布的销量双双增加了。这便是一个典型的物品协同过滤的例子。

基于物品的协同过滤指基于物品的行为相似度(如啤酒尿布被同时购买)来进行物品推荐。该算法认为,物品A和物品B具有很大相似度是因为喜欢物品A的用户大都也喜欢物品B。

基于物品的协同过滤算法主要分为两步:

基于物品的协同过滤算法中计算物品相似度的方法有以下几种:

(1)基于共同喜欢物品的用户列表计算。

此外,John S. Breese再其论文中还提及了IUF(Inverse User Frequence,逆用户活跃度)的参数,其认为活跃用户对物品相似度的贡献应该小于不活跃的用户,应该增加IUF参数来修正物品相似度的公式:

上面的公式只是对活跃用户做了一种软性的惩罚, 但对于很多过于活跃的用户, 比如某位买了当当网80%图书的用户, 为了避免相似度矩阵过于稠密, 我们在实际计算中一般直接忽略他的兴趣列表, 而不将其纳入到相似度计算的数据集中。

(2)基于余弦相似度计算。

(3)热门物品的惩罚。

从上面(1)的相似度计算公式中,我们可以发现当物品 i 被更多人购买时,分子中的 N(i) ∩ N(j) 和分母中的 N(i) 都会增长。对于热门物品,分子 N(i) ∩ N(j) 的增长速度往往高于 N(i),这就会使得物品 i 和很多其他的物品相似度都偏高,这就是 ItemCF 中的物品热门问题。推荐结果过于热门,会使得个性化感知下降。以歌曲相似度为例,大部分用户都会收藏《小苹果》这些热门歌曲,从而导致《小苹果》出现在很多的相似歌曲中。为了解决这个问题,我们对于物品 i 进行惩罚,例如下式, 当α∈(0, 0.5) 时,N(i) 越小,惩罚得越厉害,从而使热门物品相关性分数下降( 博主注:这部分未充分理解 ):

此外,Kary pis在研究中发现如果将ItemCF的相似度矩阵按最大值归一化, 可以提高推荐的准确率。 其研究表明, 如果已经得到了物品相似度矩阵w, 那么可以用如下公式得到归一化之后的相似度矩阵w':

归一化的好处不仅仅在于增加推荐的准确度,它还可以提高推荐的覆盖率和多样性。一般来说,物品总是属于很多不同的类,每一类中的物品联系比较紧密。假设物品分为两类——A和B, A类物品之间的相似度为0.5, B类物品之间的相似度为0.6, 而A类物品和B类物品之间的相似度是0.2。 在这种情况下, 如果一个用户喜欢了5个A类物品和5个B类物品, 用ItemCF给他进行推荐, 推荐的就都是B类物品, 因为B类物品之间的相似度大。 但如果归一化之后, A类物品之间的相似度变成了1, B类物品之间的相似度也是1, 那么这种情况下, 用户如果喜欢5个A类物品和5个B类物品, 那么他的推荐列表中A类物品和B类物品的数目也应该是大致相等的。 从这个例子可以看出, 相似度的归一化可以提高推荐的多样性。

那么,对于两个不同的类,什么样的类其类内物品之间的相似度高,什么样的类其类内物品相似度低呢?一般来说,热门的类其类内物品相似度一般比较大。如果不进行归一化,就会推荐比较热门的类里面的物品,而这些物品也是比较热门的。因此,推荐的覆盖率就比较低。相反,如果进行相似度的归一化,则可以提高推荐系统的覆盖率。

最后,利用物品相似度矩阵和用户打过分的物品记录就可以对一个用户进行推荐评分:

基于用户的协同算法与基于物品的协同算法原理类似,只不过基于物品的协同是用户U购买了A物品,会计算经常有哪些物品与A一起购买(也即相似度),然后推荐给用户U这些与A相似的物品。而基于用户的协同则是先计算用户的相似性(通过计算这些用户购买过的相同的物品),然后将这些相似用户购买过的物品推荐给用户U。

基于用户的协同过滤算法主要包括两个步骤:

步骤(1)的关键是计算用户的兴趣相似度,主要是利用用户的行为相似度计算用户相似度。给定用户 u 和 v,N(u) 表示用户u曾经有过正反馈(譬如购买)的物品集合,N(v) 表示用户 v 曾经有过正反馈的物品集合。那么我们可以通过如下的 Jaccard 公式简单的计算 u 和 v 的相似度:

或通过余弦相似度:

得到用户之间的相似度之后,UserCF算法会给用户推荐和他兴趣最相似的K个用户喜欢的物品。如下的公式度量了UserCF算法中用户 u 对物品 i 的感兴趣程度:

首先回顾一下UserCF算法和ItemCF算法的推荐原理:UserCF给用户推荐那些和他有共同兴趣爱好的用户喜欢的物品, 而ItemCF给用户推荐那些和他之前喜欢的物品具有类似行为的物品。

(1)从推荐场景考虑

首先从场景来看,如果用户数量远远超过物品数量,如购物网站淘宝,那么可以考虑ItemCF,因为维护一个非常大的用户关系网是不容易的。其次,物品数据一般较为稳定,因此物品相似度矩阵不必频繁更新,维护代价较小。

UserCF的推荐结果着重于反应和用户兴趣相似的小群体的热点,而ItemCF的推荐结果着重于维系用户的历史兴趣。换句话说,UserCF的推荐更社会化,反应了用户所在小型兴趣群体中物品的热门程度,而ItemCF的推荐更加个性化,反应了用户自己的个性传承。因此UserCF更适合新闻、微博或微内容的推荐,而且新闻内容更新频率非常高,想要维护这样一个非常大而且更新频繁的表无疑是非常难的。

在新闻类网站中,用户的兴趣爱好往往比较粗粒度,很少会有用户说只看某个话题的新闻,而且往往某个话题也不是每天都会有新闻。 个性化新闻推荐更强调新闻热点,热门程度和时效性是个性化新闻推荐的重点,个性化是补充,所以 UserCF 给用户推荐和他有相同兴趣爱好的人关注的新闻,这样在保证了热点和时效性的同时,兼顾了个性化。

(2)从系统多样性(也称覆盖率,指一个推荐系统能否给用户提供多种选择)方面来看,ItemCF的多样性要远远好于UserCF,因为UserCF更倾向于推荐热门物品。而ItemCF具有较好的新颖性,能够发现长尾物品。所以大多数情况下,ItemCF在精度上较小于UserCF,但其在覆盖率和新颖性上面却比UserCF要好很多。

在介绍本节基于矩阵分解的隐语义模型之前,让我们先来回顾一下传统的矩阵分解方法SVD在推荐系统的应用吧。

基于SVD矩阵分解在推荐中的应用可分为如下几步:

SVD在计算前会先把评分矩阵 A 缺失值补全,补全之后稀疏矩阵 A 表示成稠密矩阵,然后将分解成 A' = U∑V T 。但是这种方法有两个缺点:(1)补成稠密矩阵后需要耗费巨大的储存空间,对这样巨大的稠密矩阵进行储存是不现实的;(2)SVD的计算复杂度很高,对这样大的稠密矩阵中进行计算式不现实的。因此,隐语义模型就被发明了出来。

更详细的SVD在推荐系统的应用可参考 奇异值分解SVD简介及其在推荐系统中的简单应用 。

隐语义模型(Latent Factor Model)最早在文本挖掘领域被提出,用于找到文本的隐含语义。相关的算法有LSI,pLSA,LDA和Topic Model。本节将对隐语义模型在Top-N推荐中的应用进行详细介绍,并通过实际的数据评测该模型。

隐语义模型的核心思想是通过隐含特征联系用户兴趣和物品。让我们通过一个例子来理解一下这个模型。

现有两个用户,用户A的兴趣涉及侦探小说、科普图书以及一些计算机技术书,而用户B的兴趣比较集中在数学和机器学习方面。那么如何给A和B推荐图书呢?

我们可以对书和物品的兴趣进行分类。对于某个用户,首先得到他的兴趣分类,然后从分类中挑选他可能喜欢的物品。简言之,这个基于兴趣分类的方法大概需要解决3个问题:

对于第一个问题的简单解决方案是找相关专业人员给物品分类。以图书为例,每本书出版时,编辑都会给出一个分类。但是,即使有很系统的分类体系,编辑给出的分类仍然具有以下缺点:(1)编辑的意见不能代表各种用户的意见;(2)编辑很难控制分类的细粒度;(3)编辑很难给一个物品多个分类;(4)编辑很难给一个物品多个分类;(5)编辑很难给出多个维度的分类;(6)编辑很难决定一个物品在某一个类别中的权重。

为了解决上述问题,研究员提出可以从数据出发,自动找到那些分类,然后进行个性化推荐。隐语义模型由于采用基于用户行为统计的自动聚类,较好地解决了上面提出的5个问题。

LFM将矩阵分解成2个而不是3个:

推荐系统中用户和物品的交互数据分为显性反馈和隐性反馈数据。隐式模型中多了一个置信参数,具体涉及到ALS(交替最小二乘法,Alternating Least Squares)中对于隐式反馈模型的处理方式——有的文章称为“加权的正则化矩阵分解”:

一个小细节:在隐性反馈数据集中,只有正样本(正反馈)没有负反馈(负样本),因此如何给用户生成负样本来进行训练是一个重要的问题。Rong Pan在其文章中对此进行了探讨,对比了如下几种方法:

用户行为很容易用二分图表示,因此很多图算法都可以应用到推荐系统中。基于图的模型(graph-based model)是推荐系统中的重要内容。很多研究人员把基于领域的模型也称为基于图的模型,因为可以把基于领域的模型看作基于图的模型的简单形式。

在研究基于图的模型之前,需要将用户行为数据表示成图的形式。本节的数据是由一系列用户物品二元组 (u, i) 组成的,其中 u 表示用户对物品 i 产生过行为。

令 G(V, E) 表示用户物品二分图,其中 V=V U UV I 由用户顶点 V U 和物品节点 V I 组成。对于数据集中每一个二元组 (u, i) ,图中都有一套对应的边 e(v u , v i ),其中 v u ∈V U 是用户对应的顶点,v i ∈V I 是物品i对应的顶点。如下图是一个简单的物品二分图,其中圆形节点代表用户,方形节点代表物品,用户物品的直接连线代表用户对物品产生过行为。比如下图中的用户A对物品a、b、d产生过行为。

度量图中两个顶点之间相关性的方法很多,但一般来说图中顶点的相关性主要取决于下面3个因素:

而相关性高的一对顶点一般具有如下特征:

举个例子,如下图,用户A和物品c、e没有边直连,但A可通过一条长度为3的路径到达c,而Ae之间有两条长度为3的路径。那么A和e的相关性要高于顶点A和c,因而物品e在用户A的推荐列表中应该排在物品c之前,因为Ae之间有两条路径。其中,(A,b,C,e)路径经过的顶点的出度为(3,2,2,2),而 (A,d,D,e) 路径经过了一个出度比较大的顶点D,所以 (A,d,D,e) 对顶点A与e之间相关性的贡献要小于(A,b,C,e)。

基于上面3个主要因素,研究人员设计了很多计算图中顶点相关性的方法,本节将介绍一种基于随机游走的PersonalRank算法。

假设要给用户u进行个性化推荐,可以从用户u对应的节点 v u 开始在用户物品二分图上进行随机游走。游走到任一节点时,首先按照概率α决定是继续游走还是停止这次游走并从 v u 节点重新开始游走。若决定继续游走,则从当前节点指向的节点中按照均匀分布随机选择一个节点作为游走下次经过的节点。这样,经过很多次随机游走后,每个物品被访问到的概率会收敛到一个数。最终的推荐列表中物品的权重就是物品节点的访问概率。

上述算法可以表示成下面的公式:

虽然通过随机游走可以很好地在理论上解释PersonalRank算法,但是该算法在时间复杂度上有明显的缺点。因为在为每个用户进行推荐时,都需要在整个用户物品二分图上进行迭代,知道所有顶点的PR值都收敛。这一过程的时间复杂度非常高,不仅无法在线进行实时推荐,离线计算也是非常耗时的。

有两种方法可以解决上面PersonalRank时间复杂度高的问题:

(1)减少迭代次数,在收敛之前停止迭代。但是这样会影响最终的精度。

(2)从矩阵论出发,重新涉及算法。另M为用户物品二分图的转移概率矩阵,即:

网络社交是当今社会非常重要甚至可以说是必不可少的社交方式,用户在互联网上的时间有相当大的一部分都用在了社交网络上。

当前国外最著名的社交网站是Facebook和Twitter,国内的代表则是微信/QQ和微博。这些社交网站可以分为两类:

需要指出的是,任何一个社交网站都不是单纯的社交图谱或兴趣图谱。如QQ上有些兴趣爱好群可以认识不同的陌生人,而微博中的好友也可以是现实中认识的。

社交网络定义了用户之间的联系,因此可以用图定义社交网络。我们用图 G(V,E,w) 定义一个社交网络,其中V是顶点集合,每个顶点代表一个用户,E是边集合,如果用户va和vb有社交网络关系,那么就有一条边 e(v a , v b ) 连接这两个用户,而 w(v a , v b )定义了边的权重。一般来说,有三种不同的社交网络数据:

和一般购物网站中的用户活跃度分布和物品流行度分布类似,社交网络中用户的入度(in degree,表示有多少人关注)和出度(out degree,表示关注多少人)的分布也是满足长尾分布的。即大部分人关注的人都很少,被关注很多的人也很少。

给定一个社交网络和一份用户行为数据集。其中社交网络定义了用户之间的好友关系,而用户行为数据集定义了不同用户的历史行为和兴趣数据。那么最简单的算法就是给用户推荐好友喜欢的物品集合。即用户u对物品i的兴趣 p ui 可以通过如下公式计算。

用户u和用户v的熟悉程度描述了用户u和用户在现实社会中的熟悉程度。一般来说,用户更加相信自己熟悉的好友的推荐,因此我们需要考虑用户之间的熟悉度。下面介绍3中衡量用户熟悉程度的方法。

(1)对于用户u和用户v,可以使用共同好友比例来计算他们的相似度:

上式中 out(u) 可以理解为用户u关注的用户合集,因此 out(u) ∩ out(v) 定义了用户u、v共同关注的用户集合。

(2)使用被关注的用户数量来计算用户之间的相似度,只要将公式中的 out(u) 修改为 in(u):

in(u) 是指关注用户u的集合。在无向社交网络中,in(u)和out(u)是相同的,而在微博这种有向社交网络中,这两个集合的含义就不痛了。一般来说,本方法适合用来计算微博大V之间的相似度,因为大v往往被关注的人数比较多;而方法(1)适用于计算普通用户之间的相似度,因为普通用户往往关注行为比较丰富。

(3)除此之外,还可以定义第三种有向的相似度:这个相似度的含义是用户u关注的用户中,有多大比例也关注了用户v:

这个相似度有一个缺点,就是在该相似度下所有人都和大v有很大的相似度,这是因为公式中的分母并没有考虑 in(v) 的大小,所以可以把 in(v) 加入到上面公式的分母,来降低大v与其他用户的相似度:

上面介绍了3种计算用户之间相似度(或称熟悉度)的计算方法。除了熟悉程度,还需要考虑用户之间的兴趣相似度。我们和父母很熟悉,但很多时候我们和父母的兴趣确不相似,因此也不会喜欢他们喜欢的物品。因此,在度量用户相似度时,还需要考虑兴趣相似度,而兴趣相似度可以通过和UserCF类似的方法度量,即如果两个用户喜欢的物品集合重合度很高,两个用户的兴趣相似度很高。

最后,我们可以通过加权的形式将两种权重合并起来,便得到了各个好有用户的权重了。

有了权重,我们便可以针对用户u挑选k个最相似的用户,把他们购买过的物品中,u未购买过的物品推荐给用户u即可。打分公式如下:

其中 w' 是合并后的权重,score是用户v对物品的打分。

node2vec的整体思路分为两个步骤:第一个步骤是随机游走(random walk),即通过一定规则随机抽取一些点的序列;第二个步骤是将点的序列输入至word2vec模型从而得到每个点的embedding向量。

随机游走在前面基于图的模型中已经介绍过,其主要分为两步:(1)选择起始节点;(2)选择下一节点。起始节点选择有两种方法:按一定规则抽取一定量的节点或者以图中所有节点作为起始节点。一般来说会选择后一种方法以保证所有节点都会被选取到。

在选择下一节点方法上,最简单的是按边的权重来选择,但在实际应用中需要通过广度优先还是深度优先的方法来控制游走范围。一般来说,深度优先发现能力更强,广度优先更能使社区内(较相似)的节点出现在一个路径里。

斯坦福大学Jure Leskovec教授给出了一种可以控制广度优先或者深度优先的方法。

以上图为例,假设第一步是从t随机游走到v,这时候我们要确定下一步的邻接节点。本例中,作者定义了p和q两个参数变量来调节游走,首先计算其邻居节点与上一节点t的距离d,根据下面的公式得到α:

一般从每个节点开始游走5~10次,步长则根据点的数量N游走根号N步。如此便可通过random walk生成点的序列样本。

得到序列之后,便可以通过word2vec的方式训练得到各个用户的特征向量,通过余弦相似度便可以计算各个用户的相似度了。有了相似度,便可以使用基于用户的推荐算法了。

推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣,因此大量的用户行为数据就成为推荐系统的重要组成部分和先决条件。如何在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题。

冷启动问题主要分为三类:

针对用户冷启动,下面给出一些简要的方案:

(1)有效利用账户信息。利用用户注册时提供的年龄、性别等数据做粗粒度的个性化;

(2)利用用户的社交网络账号登录(需要用户授权),导入用户在社交网站上的好友信息,然后给用户推荐其好友喜欢的物品;

(3)要求用户在登录时对一些物品进行反馈,手机用户对这些物品的兴趣信息,然后给用推荐那些和这些物品相似的物品;

(4)提供非个性化推荐。非个性化推荐的最简单例子就是热门排行榜,我们可以给用户推荐热门排行榜,然后等到用户数据收集到一定的时候,在切换为个性化推荐。

对于物品冷启动,可以利用新加入物品的内容信息,将它们推荐给喜欢过和他们相似的物品的用户。

对于系统冷启动,可以引入专家知识,通过一定高效的方式快速建立起物品的相关度表。

在上面介绍了一些推荐系统的基础算法知识,这些算法大都是比较经典且现在还在使用的。但是需要注意的是,在实践中,任何一种推荐算法都不是单独使用的,而是将多种推荐算法结合起来,也就是混合推荐系统,但是在这里并不准备介绍,感兴趣的可以查阅《推荐系统》或《推荐系统与深度学习》等书籍。此外,在推荐中非常重要的点击率模型以及基于矩阵的一些排序算法在这里并没有提及,感兴趣的也可自行学习。

虽然现在用的很多算法都是基于深度学习的,但是这些经典算法能够让我们对推荐系统的发展有一个比较好的理解,同时,更重要的一点——“推陈出新”,只有掌握了这些经典的算法,才能提出或理解现在的一些更好地算法。

gafata 是什么

gafata指的是腾讯、阿里、苹果、谷歌、亚马逊、Facebook。G谷歌 、A苹果、 F脸书 、A亚马逊、 T腾讯、 A阿里。

G(Google)谷歌公司(Google Inc.)成立于1998年9月4日,由拉里·佩奇和谢尔盖·布林共同创建,被公认为全球最大的搜索引擎公司。

A(Amazon)亚马逊公司(Amazon,简称亚马逊;NASDAQ:AMZN),是美国最大的一家网络电子商务公司,位于华盛顿州的西雅图。是网络上最早开始经营电子商务的公司之一,亚马逊成立于1995年。

F(Facebook)Facebook(中文译为脸书或者脸谱网 )是美国的一个社交网络服务网站 ,创立于2004年2月4日,总部位于美国加利福尼亚州门洛帕克。2012年3月6日发布Windows版桌面聊天软件Facebook Messenger 。主要创始人马克·扎克伯格(Mark Zuckerberg)。

扩展资料

gafata中 T腾讯控股从2004年6月16日上市,当天收盘价4.15元,之后最高涨到220.8元,复权价格1112.83元,涨幅268倍;昨天收盘193.3元,复权价格975.33元,涨幅235倍。也就是说2004年买入10万元的腾讯控股,昨天收盘后市值2350万元。

当然,几乎不可能有人从第一天收盘买入一直拿到现在,但在这十几年的过程中,几乎任何时候买入都会受益颇丰,而且之后仍“有可能”继续成长,不过速度不可能像之前那么快了。再次引用一下专栏的原话:“很可能”也不是“一定”!投资就会有风险,这是一个概率问题。所以,投资的钱必须是“闲钱”,甚至“把这笔投资完全丢掉都不会影响自己的生活”。

参考资料来源:百度百科-Amazon

参考资料来源:百度百科-Google

参考资料来源:百度百科-Facebook

西雅图facebook分部图片的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于facebook发图、西雅图facebook分部图片的信息别忘了在本站进行查找喔。

程先分享

本文链接:http://cxvlog.com/facebook/28049.html