InfoQ中文版

2021-01-27 21:17    2021-01-28 00:17

Apache ECharts 正式毕业,成为 ASF 顶级项目

1 月 26 日,Apache 基金会官方宣布 ECharts 项目正式毕业,成为 Apache 顶级项目。Apache ECharts 是由百度团队开源,并于 2018 年捐赠给 Apache 基金会。这是一款基于 JavaScript 的数据可视化图标库,可以生产直观、可交互、定制化的数据可视化图表。据悉,在从 Apache 基金会毕业的同时,ECharts 将会发布大版本 ECharts 5。

数据库内核杂谈(十五): 执行器之code generation vs vectorized execution

本文是数据库内核系列文章之一。从本文开始,我们一起来学习一下数据库引擎执行器中非常出名的两种优化方式,code generation(代码生成;以下简称code-gen)和vectorized execution(向量计算;以下简称vec-exec)。为什么说学习呢,因为自己确实也没做过。所有的学习资料也是阅读一些技术博客和技术论文,我会仔细阅读,争取可以用深入浅出的语言写出来。 说到code-gen和vec-exec,这两个概念出自两篇非常有名的文章。

华为人事突变的背后:余承东能给云计算怎样的未来?

关于余承东的去向,业界讨论了一天,终于在1月27日下午得到确定:消费者BG CEO位置保留,拟增任命Cloud &AI BG总裁(兼)、Cloud & AI BG行政管理团队主任、增任命Cloud BU总裁(兼)、Cloud BU行政管理团队主任。余承东去向已定,华为高端手机业务出售疑云尚存1月27日一早,多家媒体纷纷报道称:余承东将负责华为云与计算BG,2月份正式对外宣布。InfoQ随后就此消息求证华为相关人士,得到的回复是:不信谣、不传谣。

Pulsar 和 Kafka 基准测试报告(上)

为了更全面地了解 Pulsar 和 Kafka,我们“复现”了 Confluent 对 Pulsar 和 Kafka 基准测试。重复这一基准测试的原因有两个,一是 Confluent 的测试方法存在一些问题;二是 Confluent 的测试范围和测试场景不够全面。为了更准确地对比 Pulsar 和 Kafka,我们在测试中不仅修复了 Confluent 测试中的问题,还扩大了测试范围,纳入更多性能衡量标准,模拟更多实际场景。和 Confluent 的测试相比,我们的测试主要有三项改进:包含 Pulsar 和 Kafka 支持的所有持久性级别。在同等持久性级别下,对比二者的吞吐量和延迟。

我的一年数据科学学习之旅

本文讲述了作者在去年的数据科学学习之旅中遇到了一些困难,以及如何解决这些难题的。Eric Weber(没错,就是那个养着一条可爱小狗的帅哥)最近在 LinkedIn 上发表了一篇文章,讲了十件他希望开始数据科学职业时能少做的事情。本文就是我对这十件事所经历的过程。你应该先读读他的文章。下面是截图。首先,这不会是一篇“内容”的文章。关于这方面的文章和博客文章已经很多了,大家可以去找找。在本文中,我们将讨论当你渴望成为数据科学家并获得业界关注时,你关注的重点和方向。1、认为自己什么都要学点击查看原文>

Arm 与 x86 CPU 在云计算中的性能分析

随着基于 Arm 的高性能 CPU 越来越多地应用于移动设备之外,对于开发者来说,了解 Arm 在常见服务端软件堆栈中的性能特征至关重要。 本文将使用 AWS 的 Arm(Graviton2) 和 x86_64 (Intel) EC2 实例来评估不同软件运行时,包括Docker、Node.js 和 WebAssembly 的计算性能。 结论是,Arm 在云中更具成本效益,尤其是在与底层操作系统接近的轻量级运行时中。

还不知道简历如何写?就该这样写!

这样写简历才不会被刷!点击查看原文>

Jeff Dean三执笔:一文看尽2020年谷歌AI重大突破

在二十年前刚刚加入谷歌时,我们关注的问题只有一个——如何面向这么多不同种类的联网计算机提供一整套质量出色且涵盖范围全面的网络信息搜索服务。到如今,尽管我们面临着各种各样的技术挑战,但谷歌已经基本达成了组织全球信息,并使其具备普遍可访问性的总体目标。到2020年,随着COVID-19肆虐全球,我们意识到研发技术能够帮助全球数十亿人更好地交流、了解事态发展并找到新的工作方式。我为我们取得的成就感到自豪,也为即将出现的全新可能性感到振奋。谷歌研究院的目标是解决一系列具有广泛意见的长期问题——从预测COVID-19疫情的蔓延路径到设计算法、愈发强大的自动翻译服务,再到缓解机器学习模型中的偏见问题等。

苹果造出自动驾驶电动汽车,至少还需要等5年

2014 年,苹果推出了泰坦计划,但七年来,苹果汽车项目进展缓慢,内部关于是“制造整车”还是“做自动驾驶系统供应商”的争论一度使其几经搁浅。它因此错过了造车的最好时机,而这个机会被特斯拉抓住了。正如当年乔布斯开创了智能手机时代,马斯克也在用特斯拉重新定义智能汽车。2020 年,苹果又重新启动了造车计划,中国“造车三兄弟”相继在美股上市,传统汽车企业纷纷启动转型,华为、阿里等互联网科技巨头也开始磨刀亮剑新能源市场。众敌围攻,苹果此时进场,还有机会吗?苹果公司拥有一个小团队,专门研发一款新车,希望最终能和特斯拉竞争,但是开发工作还处在初期。

科技创投媒体36Kr的容器化之路

36Kr是一家创立于2010年,专注于科技创投领域的媒体公司,业务场景并不复杂,前端主要使用NodeJS进行Render,移动端有Android也有iOS,后端服务几乎全都由PHP来支持。点击查看原文>

创业失败,我决定开源所有产品代码

近日,一位程序员在Reddit上发帖称自己创业失败了,因此将其产品代码开源,希望能帮助到有需要的人。 这款产品叫做“Dryvo”,是一款为驾校行业提供的解决方案。目标是节省老师在课程安排、处理学生来电、付款等杂事上耗费的时间,同时也能让学生掌握驾驶考试的学习进度以及帮助他们了解整个学习流程,此外,高效的路线规划功能可以帮助老师节省宝贵的时间,并减少油费。Dryvo期望改变驾驶课程的管理方式。 目前,该产品代码已经托管在GitHub上,项目地址:https://github.com/AdamGold/Dryvo。 

我们为什么构建自己的serverless计算平台,而非使用AWS Lambda?

本文最初发表于Cortex网站,经原作者Caleb Kaiser许可由InfoQ中文站翻译分享。对于模型部署来讲,AWS Lambda是一个很有吸引力的方案。从表面上来看,其收益是很明显的。Lambda可以:让数据科学家和机器学习工程师在部署时无需管理基础设施在最大化可用性的同时,能将成本降到最低为定义预测API提供了一个简单的接口但是,问题在于,尽管这都是serverless架构的收益,但是像Lambda这样的通用serverless平台通常会有一些限制,这些限制使得它并非机器学习的最理想方案。我们亲身体会到这一点。在着手实现Cortex之前,我们曾经尝试通过Lambda运行部署。

聊聊 React 组件库的技术选型与设计

前言最近在业务中开发了一套定制化的 C 端组件库,在这个过程中遇到了一些组件库技术选型和设计的问题,在参考公司内外的多个组件库后确定了最终的方案。本文希望通过向读者介绍技术选型的过程中的方案比较和组件库设计中的考量,让读者在组件库的技术选型和设计上有所启发。一个完整的组件库方案的思路组件库的技术选型样式方案选择事实上,这三种样式方案可以并存,但实际开发以其中一种为主。Sass/Less这是大家最熟悉的方式,它的优点是足够灵活、开发成本低(绝大多数工程师都熟悉它们)、 完全支持外部覆盖组件的样式,缺点是难以调试(需要到 runtime 才能知道命中的规则),以及难以实现静态分析。

Spring Boot 中使用监听器

本文已收录到《10万字Springboot经典学习笔记》中,点击查看原文>

联盟广告平台架构及实践

导读:随着大数据的快速发展,大数据应用已经融入各行各业,在很多场景中得到了商业化实践。今天和大家分享下58同城联盟广告平台架构及实践。主要包括:58联盟广告SSP媒体平台、投放平台、程序化创意等核心模块的设计和实现,以及对联盟业务的思考与展望。联盟广告平台简介1. 业务概述58联盟广告平台主要是以58站内的广告主为基础并结合站外流量,帮助58站内广告主获取站外潜在用户,从而实现流量变现。流量获取主要通过SSP和DSP这两种方式。联盟SSP平台可直接与媒体对接,直接在媒体上展示投放的广告。DSP是通过投放平台(例如百度SEM、腾讯广点通等)投放到媒体上展示广告。2. 业务架构点击查看原文>

Hadoop之HDFS 内部机制知多少?

探寻Hadoop里另外一个重要组件HDFS的架构和高可用相关机制点击查看原文>

keepalived 实现Nginx高可用安装

keepalived点击查看原文>

3分钟带你了解「消息中间件」Kafka、RocketMQ

消息中间件的应用场景异步解耦削峰填谷顺序收发分布式事务一致性腾讯应用案例:点击查看原文>

为什么 79000+ 企业研发人员都在这里学习?

在过去,一位优秀的领导者,就可以带领企业走向巅峰,像我们熟知的福特、托马斯,他们一夫当关、运筹帷幄、指挥全局。但在今天,以5G、人工智能、工业互联网、物联网为代表的新型基础设施,正在加速各行业数字化转型。这个过程中涌现出一批优秀企业,有的历史悠久,有的为近几年新兴。但它们有着共同的特点,就是努力将自己打造成“学习型组织”,培养全新、前瞻而开阔的思考模式,为未来不断扩展和创造能量。 

GPT-2会盗取你的电话号码吗?

先说结论:很可能不会。但是,OpenAI 的 GPT-2 语言模型 确实知道如何触达特定的 Peter W —(为保护隐私而删除的名称)。当出现简短的 Internet 文本提示时,该模型将准确生成 Peter 的联系信息,包括他的工作地址,电子邮件,电话和传真:在我们 最近的论文 中,我们评估了大型语言模型如何记忆和输出训练数据的这种稀有片段。我们关注 GPT-2,发现至少 0.1%的由它生成的文本(非常保守的估计)包含了从其训练集中的某篇文档中逐字“复制 - 粘贴”的长字符串。

有了石墨烯芯片,中国就可以不要光刻机了?

石墨烯虽然带来了好消息,却也引发了不小的争议…用石墨烯实现芯片弯道超车,恐怕不易2020 年 10 月,在上海举行的国际石墨烯创新大会上,国产 8 英寸石墨烯晶圆正式亮相。不同于目前的硅基晶圆,该晶圆是由碳元素为基底构成的晶圆,一旦投入量产,这种晶圆就可以用于生产全新材质的芯片。当时也有人预测,石墨烯芯片或许会改写全球芯片发展的轨迹。对于中国来说,石墨烯芯片的意义更加重要。制造是国产芯片一直以来的一块心病。自从被美国商务部添加到贸易实体名单之后,国内不少企业失去了能够代工芯片的合作伙伴,随着美国在芯片领域的对华政策一再收紧,中国芯片制造掣肘的情况日趋严重。

专访京东科技张亮:本土开源需形成吸纳开发者的靶心丨开源创新30人

据 InfoQ 不完全调研数据显示,仅在过去一年,国内便先后有超过10家开源企业获得新一轮资本助力,融资纪录为近年来开源赛道最高。与此同时,大公司开源步伐加速、国内第一家开源基金会正式成立等消息,也成为了去年本土开源领域的重磅新闻。 随着越来越多的企业、人才、资金等资源不断涌入,在本土开源这一赛道之上,未来将涌现出更多优秀的开源参与者。然而,在参与开源的过程中,更多有关于企业开源治理、社区运营等方面的难题,却依然困扰着每一位投身开源的人。 

Nebula Graph 在微众银行数据治理业务的实践

本文为微众银行大数据平台:周可在 nMeetup 深圳场的演讲这里文字稿,演讲视频参见:B站点击查看原文>

实现大规模图计算的算法思路

2017年我以深度学习研究员的身份加入Hulu,研究领域包括了图神经网络及NLP中的知识图谱推理,其中我们在大规模图神经网络计算方向的工作发表在ICLR2020主会上,题目是——Dynamically Pruned Message Passing Networks for Large-Scale Knowledge Graph Reasoning。本次分享的话题会沿着这个方向,重点和大家探讨一下并列出一些可以降低大规模图计算复杂度的思路。图神经网络简单介绍图神经网络使用的图图神经网络这几年特别火爆,无论学术界还是业界,大家都在考虑用图神经网络。

基于 Vue 的商品主图放大镜方案

前言在做电商类应用时,难免会遇到商品主图实现放大镜效果的场景,现有的基于Vue的第三方包不多并且无法直接复用,今天,我来分享一种高稳定性的基于 Vue 的图片放大镜方法。实现原理放大镜的原理用一句话概括,就是根据小图上的鼠标位置去定位大图。相信原理图已经画的很明白了, 图中,左侧框是小图框,其蓝色区域为图片遮罩层(需放大区域),右侧框是整个大图目前所在区域,其蓝色区域是放大区域,设置超出隐藏,就实现了放大遮罩区域的效果。显然,两块蓝色区域存在着某种对应关系,即遮罩的左上角位置(相对于小图,以下称 X 坐标)和放大区域(相对于大图)的左上角位置是成比例的,即放大倍数。

前端工程师需要了解的 Babel 知识

Babel 是怎么工作的Babel 是一个 JavaScript 编译器。做与不做注意很重要的一点就是,Babel 只是转译新标准引入的语法,比如:箭头函数let / const解构哪些在 Babel 范围外?对于新标准引入的全局变量、部分原生对象新增的原型链上的方法,Babel 表示超纲了。全局变量PromiseSymbolWeakMap点击查看原文>

GitLab Open API 代码量统计,让你的努力被老板看到

前言敦煌系统 是我们政采云前端团队自研的项目开发全流程管理系统,目标是将项目开发的各流程全部管理起来。从项目创建,代码初始,到代码的本地开发,提测交付,测后发布,版本回滚,数据统计等。本文便是该系统中远程项目创建及数据统计部分的实现原理。后续陆续会有敦煌系统其余部分技术文章发布。欢迎大家先关注微信公众号 “政采云前端团队”,或者掘金上关注 “政采云前端团队”,以便第一时间获取最新信息。简介本文主要介绍如何通过 GitLab Open API 进行项目创建、初始化代码及团队代码量统计。前端工程化建设过程中,需要通过 Node 服务端进行 Git 仓库创建、项目初始化和代码量统计。

急需降低系统复杂性,我们从Kafka迁移到了Pulsar

要点总结分布式消息系统支持流和队列两种语义。这两种语义最适合使用的场景有所不同。Pulsar 的独特之处在于它同时支持流和队列使用场景。Pulsar 采用多层架构,可以轻松扩展 topic 的数量和大小,比其他消息系统的操作更便捷。Pulsar 实现可扩展性、可靠性和其他特性之间的良好平衡。这有助于替换 Iterable 采用的 RabbitMQ 消息系统,并最终替换其他消息系统(如 Kafka 和 Amazon SQS)。Iterable公司每天代表客户发送大量营销消息,包括电子邮件、通知、短信、应用程序消息等,并且每天处理更多的用户数据更新、事件、自定义工作流状态。

王栋:做寻找问题本质的管理者,应该如何用好工具和方法论?|TGO 专访

王栋,小帮规划 CTO、TGO 鲲鹏会(北京)学员,原雪球 CTO (2011-2018),经历了雪球从初创到 D 轮的技术平台和团队搭建的全过程,拥有超过 15 年互联网产品开发、架构经验,以及 10 年以上产品技术团队管理经验。在互联网金融行业做了近十年的 CTO ,王栋的身上散发着一股认真劲。他花了一个多小时讲述了现在从事的工作,娓娓道来自己的一些从业经历,分享了做好技术管理的一些心得体会。对于这个时代的发展,他有着清晰的看法,“互联网时代的潜力还没有完全被挖掘出来,而技术带来的力量最终还是要和产业进行结合,才能把业务做大。

Elasticsearch partial update

partial update 似乎已经不再是 Elasticsearch 的主流,但还是记录一下。文字内容整理自 B 站中华石杉的 Elasticsearch 顶尖高手系列课程核心知识篇点击查看原文>

维基百科技术架构演进分析

维基百科技术架构演进分析点击查看原文>

Flink 助力美团数仓增量生产

本文由美团研究员、实时计算负责人鞠大升分享,主要介绍 Flink 助力美团数仓增量生产的应用实践。内容包括:1、数仓增量生产;2、流式数据集成;3、流式数据处理;4、流式 OLAP 应用;5、未来规划。点击查看原文>

「Android渲染」图像是怎样显示到屏幕上的?

Android图像显示到屏幕的。。。全流程点击查看原文>

席卷图文学习前端Flex布局

哪吒人生信条:如果你所学的东西 处于喜欢 才会有强大的动力支撑。点击查看原文>

洞若观火,聊聊旧系统升级改造那些事儿

因为常常在聊聊架构群里看到有很多朋友在问旧系统升级改造的一些原则与经验,大家面临着各种各样的问题,于是在这里跟跟大家聊聊我经历的那些旧系统改造的那些事儿。当系统日益臃肿,状况频出,难以满足公司业务发展的需要,运维感到压力山大,但公司出于保护投资的动机,又不能完全抛弃现有系统,另起炉灶。那么对该系统进行升级改造呢就不得不提上日程,因此我们首先要做的是直面系统所存在的问题,明确系统升级所需要达到的目标,再根据目标提出相应的架构解决方案。

iMove 基于 X6 + form-render 背后的思考

今天是请到阿里的狼叔给大家分享最近他们团队内部开源项目iMove基于数据可视化的一些思考。本文详细阐述了iMove的可视化编排是如何实现的,以及iMove基于 X6+form-render的思考,整体内容详细且丰富,建议先收藏再看。在今年的5月28-30日举办的 QCon全球软件开发大会(北京站)上我们也设置了“低代码探索与实践“专题,目前议题征集中,欢迎大家来QCon分享。最近,我们的项目 imove 在 github 上的 star 数增长较快,想必是有值得大家肯定的地方的。

© 云聚网互联网资讯 我要投稿 云聚网博客 DeepHub IMBA