本篇文章5521字,读完约14分钟
【阿尔法狗之父揭秘:阿尔法狗在重新进化后震惊了整个金融界】一年多前,阿尔法狗在2016年1月28日成为本期的封面文章,深度思维公司(deepmind Company)发表了一篇很重的论文,介绍了击败欧洲围棋冠军范辉的人工智能程序。5月,在以3:0击败中国棋手柯杰后,阿尔法戈宣布退役,但迪皮卡德并没有停止研究。它独特的秘密是自学的。
一个
去年,一个孩子读了世界上所有的国际象棋分数,努力工作,努力思考,在国际象棋上取得了巨大的进步。他以4比1击败了世界冠军李世石,从此不可战胜。他的名字是阿尔法狗。
今年,他的弟弟只依靠一个棋盘和两个白纸黑字的儿子。他从未见过象棋比分,也没有人指点。他白手起家,自娱自乐,自学成才,并以100比0击败了他的兄弟阿尔法狗。他的名字叫阿法源。
阿尔法元的进化速度可谓“恐怖”。
阿尔法零号学到的围棋知识(来源:深度思维论文)
阿尔法零起点最大的亮点是它不需要任何人的指导,而是通过一种全新的强化学习方法成为自己的老师,因此它在最具挑战性的围棋领域比人类更加精通。
阿尔法零级玩家不仅发现了人类数千年来拥有的许多围棋策略,还设计了人类玩家从未知晓的策略。
柯杰称之为人类尊严的“最后一道防线”,他说:
对于阿尔法戈的自我完善来说,人类太多余了。
二
今天,人工智能不再是科幻小说、新闻头条,而是真正的命运。
18日,包括瑞士信贷、高盛和摩根士丹利在内的银行都在押注机器将占领债券市场。
换句话说,股票交易阿尔法狗也可能消除所有散户投资者和交易者。
甚至华尔街的许多大型对冲基金也开始用人工智能取代基金经理。更惊人的是,负责不同交易系统的人工智能引擎不仅可以分析数据和研究报告,还可以“聚在一起”进行市场预测,然后“投票”做出最佳市场决策。
也许有一天,所有散户投资者和交易员都会离开。股票市场是在几十或几百只“阿尔法狗”之间进行的。
有些人甚至预测阿尔法狗将在下一步摧毁整个金融圈。
2000年,高盛在其纽约总部的美国现金和股票交易柜台雇佣了600名交易员。然而今天,只有两个交易者“留在家里”。
瑞银在裁员方面没有落后。这是瑞银集团八年前的交易大厅,熙熙攘攘,热闹非凡。
然而,交易大厅现在是这样的…
交易员被高盛和瑞银取代的经历只是全球金融公司的一个缩影。
荷兰国际银行宣布了一项“数字转换”计划,该计划将在未来为他们节省近9亿欧元:首先裁员5800人,占员工总数的13%;今后,视情况而定,还将有1200名员工被调动或解雇。
到2020年,德国商业银行将实现80%工作的数字化和自动化,最终将裁员9600人。此外,为了支付重组计划的成本,股息被暂停。
苏格兰皇家银行发布了一个在线人工智能客户服务系统,可以响应客户的语调。此外,它永远不需要休息,更不用说要求加班费了。
美国银行计划在消费者银行部门裁员8000多人。裁员的不仅仅是员工,还有销售渠道。自去年第三季度以来,美国银行、花旗集团和摩根大通已经关闭了389家网点。
花旗表示,在2015年至2025年的十年间,欧美银行将裁员30%,员工人数最多可达170万。
人工助理替代的威胁不再遥远,失业将是数百万银行家在不久的将来不得不面对的风险。
三
不要成为潮流的敌人。谁能领导人工智能,谁就能控制人类的未来!
昨天,科技部正式宣布:
中国正在加紧实施国家新一代人工智能发展计划,并开始为实施重大人工智能项目做准备。
推进人工智能国家开源开放创新平台建设,初步认为百度、阿里、腾讯、科达讯飞(002230)将在自主驾驶、城市脑、医学影像、智能语音等技术方向试点建设人工智能国家开源开放创新平台。
联系前段时间国家下发的文件中的一句话:要发挥全国的力量,就必须在2030年抢占人工智能的全球制高点!
如果我们落后,就会被打败。这一课被中国人深深理解了。
代表中国最先进的人工智能公司的百度、阿里、腾讯和iFlytek都付出了巨大的努力,现在他们在自动驾驶、城市大脑、医学影像和智能语音的发展上已经达到了令人瞠目结舌的地步!
例如,这些新发布的无人企业:
1.淘汰无人餐馆的服务员。
马云的“未来智能餐厅”首次亮相,没有钱包和手机,也没有服务员和收银员,整个过程都是智能点餐和付款。晚饭后,就离开。当你外出时,支付宝会自动为你付款。
2.没有人来找财务:财务人员的工作地位岌岌可危!
德勤“勤奋员工”的曝光引发了一场行业地震。从视频中可以清楚地看到,“勤劳的人们”可以在几分钟内完成只能由财务完成的基础工作,也可以连续工作!
3.没有医疗:医生的地位也难以保障!
下面的视频显示,“人工智能医生”在江苏做出了第一个诊断,而机器人(300024,诊断单元)“沃森”在10秒钟内给出了一个肿瘤治疗的案例。
一个超级人工智能一旦被创造出来,将会是地球历史上最强大的物种。所有的生物,包括人类,都只能比他们差。
四
这个国家正在拼命追随这一趋势。我们做什么呢
马斯克说,在未来20年里,12%到15%的全球劳动力将因为人工智能而失业。李开复更严厉地说,10-15年后,也许50%的人可能面临部分或全部的工作替换。
在接下来的几十年里,只有三种人能勉强抵挡人工智能的冲击,即资本家、明星和技术工人。
换句话说,面对日益逼近的人工智能:
要么你积累财富,成为资本掠夺者。
要么积累名声,成为独一无二的个体。
要么积累知识,成为先进技术的大师。
但是如果你不改变,你只能被社会淘汰,丢掉工作。
过去的荣耀已经过去,未来的荣耀属于你。如果你想把握未来,你必须提高自己,赶上现在的潮流。
@断桥:deepmind今天发布了阿尔法零号的论文。它结合了评估网络和策略网络,不输入任何人棋分数,只依靠自我游戏训练。3天后,它超越了alphago lee(击败李世石的版本),21天后,它超越了AlphaGo master(以60-0击败顶级人类玩家的版本),达到了5200的elo分数(从人类的角度来看,这相当于让位于master)。对抗阿尔法戈大师有100%的胜率。
要做到这一切,你只需要谷歌的4 tpu。从0开始的3天电脑练习超过了人类棋手200年的积累。
最强壮的阿尔法狗出生了3天,并在100:0粉碎了旧版本
@王佑:太可怕了。谷歌深度思维团队已经重新训练了一只阿尔法狗,阿尔法零号,它根本不依赖于人类的象棋分数,而是依靠它的左手和右手互相摆动。第一局棋在幼儿园阶段是完全盲的,第二局棋有老一套、角球、反夹和角球。在第三盘棋中,有一场屠龙,白棋很清楚地判断是生是死,并直接放弃了。
经过40天的训练,在乌镇打败柯杰的老版阿尔法狗已经爆炸了。。凭借国内最强的人工智能,腾讯团队暂停了九位来自各行各业的玩家的“绝活”,观看并分析了阿尔法零对老大师的比赛。绝艺根本不懂双方的棋步,也不能判断谁赢谁输。胜率一直在大幅波动。好吧,如果你有第二个孩子,你无论如何都会被奴役。
@棋手柯杰:一个纯粹自学的阿尔法战士是最强的...为了阿尔法戈的自我提升...人类太多余了。
历史上最强壮的阿尔法狗诞生了
“新狗”阿尔法狼的级别已经超过了所有以前版本的阿尔法狼。Alphago Zero以100:0的绝对优势击败了曾经赢得韩国棋手李世石的Alphago版本。
阿尔法戈项目首席研究员大卫·西尔弗(David silver)表示,阿尔法戈零级优于所有以前版本的阿尔法戈,尤其值得一提的是,它击败了曾经击败世界围棋冠军李世石的老版本。
10月18日伦敦当地时间18: 00(北京时间19日01: 00),阿尔法戈再次出现在世界顶级科学杂志《自然》上。
一年多前,阿尔法戈是2016年1月28日本期的封面文章。deepmind公司发表了一篇很重的论文,介绍了这个击败了欧洲围棋冠军范辉的人工智能程序。
今年5月,在以3:0击败中国棋手柯杰后,阿尔法戈宣布退役,但deepmind并没有停止研究。10月18日,伦敦当地时间,深度思维团队宣布了阿尔法戈的最强版本,代号阿尔法戈零。
它独特的秘密是“自学”。此外,它从一张白纸开始,在零基础上学习,并在短短3天内成为顶级大师。
据该团队称,阿尔法go zero已经超越了所有以前版本的阿尔法go。Alphago Zero以100:0的绝对优势击败了曾经赢得韩国棋手李世石的Alphago版本。
深度思维小组在10月18日的《自然》杂志上以论文的形式发表了关于阿尔法零号的相关研究。
阿尔法戈在两年内的成就令人震惊。现在,阿尔法零是我们最强的版本,它已经改进了很多。
Demis demis hassabis是alphago的创始人,同时也是deepmind的联合创始人和首席执行官,他说:“Zero提高了计算效率,并且不使用任何Go数据。”最后,我们希望利用它的算法突破来帮助解决各种紧迫的现实问题,例如蛋白质折叠或设计新材料。
如果我们能通过alphago在这些问题上取得进展,那么它就有潜力促进人们对生活的理解,并以积极的方式影响我们的生活。"
不再受人类知识的限制,只使用了4 tpu
alphago的前一个版本结合了数百万围棋专家的棋谱和监督学习来训练自己。
在击败人类围棋专业大师之前,它已经被训练了几个月,依靠多台机器和48 tpu(谷歌专门开发的芯片,用于加速深层神经网络的计算能力)。
在此基础上,阿尔法零号的能力得到了质的提高。最大的区别在于它不再需要人类数据。也就是说,它从一开始就没有接触过人类象棋。
R&D队只是让它在棋盘上自由下棋,然后玩自我游戏。值得一提的是,阿尔法零号也是非常“低碳”的,只用了一台机器和四个tpu,这大大节约了资源。
阿尔法零强化学习下的自我游戏。经过几天的训练,阿尔法零级已经完成了近500万个自我游戏,并且已经能够超越人类,击败所有以前版本的阿尔法零级。
deepmind团队在官方博客上表示,zero通过更新的神经网络和搜索算法进行了重组,随着训练的深入,系统的性能逐渐提高。自我博弈的结果越来越好,同时,神经网络也变得更加精确。
alphago zero获取知识的过程“这些技术细节之所以比以前的版本更强大,是因为我们不再受人类知识的限制,它可以向alphago本身学习,Alphago本身是Go领域的最高玩家。”阿尔法戈团队负责人大卫·席尔瓦说。
据大卫席尔瓦称,阿尔法戈零通过使用一种新的强化学习方法,已经把自己变成了一名教师。起初,系统甚至不知道围棋是什么,而是从一个单一的神经网络开始,通过神经网络强大的搜索算法自己下棋。
随着自我博弈的增加,神经网络逐渐调整以提高预测下一步的能力,最终赢得博弈。更重要的是,随着训练的深入,deepmind团队发现alphago zero也独立地发现了游戏规则,并走出了新的策略,给古老的围棋游戏带来了新的见解。
经过三天的自学,我打败了老阿尔法狼
除了上述差异,阿尔法零显然不同于以前的版本在三个方面。
阿尔法零号训练时间表首先,阿尔法零号仅使用棋盘上的黑白字符作为输入,而前一代包括少量人工设计的特征输入。
其次,阿尔法零只使用一个单一的神经网络。在之前的版本中,alphago使用“战略网络”来选择下一步行动,使用“价值网络”来预测每一步行动后的赢家。
在新版本中,这两个神经网络被合并为一个,因此它可以得到更有效的训练和评估。
第三,阿尔法零号没有使用快速和随机行走的方法。在以前的版本中,阿尔法戈使用快速行走的方法来预测当前情况下哪个玩家会赢得游戏。相反,新版本依靠其高质量的神经网络来评估下棋的情况。
alphago几个版本的排名?根据Hassabis和Silva的说法,这些差异有助于新版本的alphago改进其系统,而算法的改变使系统更强大、更有效。
经过仅仅三天的自我训练,阿尔法零级击败了之前以100:0击败李世石的老版本阿尔法零级。经过40天的自我训练,阿尔法零级再次击败阿尔法戈大师。“大师”击败了世界顶尖围棋选手,甚至包括世界第一的柯杰。
图为深度思维阿尔法戈项目首席研究员大卫·西尔弗和首席执行官德米斯·哈萨比斯
席尔瓦继续说道:“阿尔法零号在每场比赛后实际上都训练了一个新的神经网络。”它改进了自己的神经网络,预测了阿尔法零号自己的棋路,也预测了这些游戏的赢家。
当阿尔法零号做到这一点时,它实际上会产生一个更强大的神经网络,这将引导“玩家”进行新的迭代。
因此,我们最终得到了新版本的alphago zero,它比前一个版本更强大。随着这个过程的重复,它也可以产生更高质量的数据,这些数据可以用来训练更好的神经网络。"
“新狗”阿尔法零的未来
通过数以百万计的自我游戏,阿尔法戈从零开始掌握了围棋,并在短短几天内积累了人类几千年来所拥有的知识。
然而,阿尔法零号也发现了新的知识,开发了非常规战略和新的技巧,这些都比它在对抗李世石和柯杰时创造的要好。
这些创造性的时刻让我们相信,人工智能将成为人类智能的增强器,并帮助我们解决人类面临的一些严峻挑战。尽管阿尔法零号刚刚开发出来,但它已经朝着上述目标迈出了关键的一步。
深度思维的使命是利用人工智能来促进人类社会的进步,对于深度思维来说,围棋并不是阿尔法围棋的终极意义。他们的目标始终是使用阿尔法戈创造一个宇宙探索的通用终极工具。
随着alphago zero的推广,deepmind在利用人工智能技术改变人类命运方面取得了突破。目前,他们正积极与英国医疗机构以及电力和能源部门合作,以提高医疗效率和能源效率。
(综合中国证券经纪合作网公开号码、知道公开号码、钛媒体)
来源:罗马观察报
标题:阿尔法狗之父揭秘:阿尔法狗再进化后 震惊整个金融圈
地址:http://www.l7k9.com/gcbyw/11633.html