-
为何很多人宁可用 Excel 也不用 Python
所属栏目:[大数据] 日期:2022-06-25 热度:164
有人说,Python即使不是最好的编程语言,也是最受欢迎的语言之一。因为它简洁易用,功能强大,对初学者也很友好。在众多培训机构的小广告中,学了Python就能批量处理Excel表格,Python是实现办公自动化的利器,从此告别996之类的口号随处可见。但实际工作[详细]
-
字节跳动数据平台技术揭晓
所属栏目:[大数据] 日期:2022-06-25 热度:133
ClickHouse作为目前业内主流的列式存储数据库(DBMS)之一,拥有着同类型DBMS难以企及的查询速度。作为该领域中的后起之秀,ClickHouse已凭借其性能优势引领了业内新一轮分析型数据库的热潮。但随着企业业务数据量的不断扩大,在复杂query场景下,ClickHouse[详细]
-
云迁移之后 企业凭什么充分挖掘数据潜力
所属栏目:[大数据] 日期:2022-06-25 热度:134
近年来,基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)等业务模式正飞速发展,也推动着云投资屡创新高。根据GlobalData的报告,2024年亚太地区云计算市场规模预计将达到1918亿美元,2019至2024年期间的复合年增长率为7.7%。 然而,云迁[详细]
-
数据科学家应对的几大挑战及解决方法
所属栏目:[大数据] 日期:2022-06-25 热度:128
每天,全球各地的组织都在寻找2.5万亿字节的数据,以获得对其业务的见解和价值驱动的行动。为了实现这一目标,需要高技能的科学专家或数据科学家参与开发业务中的企业AI。在不断增长的业务领域中,数据科学家的每一个行动都有助于改进业务的功能。 下面来[详细]
-
使用Java和Python进行数据统计和剖析
所属栏目:[大数据] 日期:2022-06-25 热度:74
Java 和 Python 是当今最流行的两种计算机语言。两者都非常成熟,并提供了工具和技术生态系统,帮助我们解决数据科学领域出现的挑战性问题。每种语言都各有优势,我们要知道什么时候应该使用哪种工具,或者什么时候它们应该协同工作相互补充。 Python 是一[详细]
-
终于有人把MPP大数据系统架构讲清楚了
所属栏目:[大数据] 日期:2022-06-25 热度:163
本文首先回顾并行硬件架构的发展,并进一步介绍基于并行硬件架构的数据库一体机系统与基于MPP架构的数据库软件系统。数据库一体机系统在银行等大型企业中采用广泛,一体机的优点是开箱即用、功能丰富、稳定、售后服务好,缺点是价格昂贵、扩展不灵活。基于[详细]
-
云数据仓库中的数据安全思虑
所属栏目:[大数据] 日期:2022-06-25 热度:120
近年来,由于云计算与云存储具有一定的廉价性和可扩展性,云数据仓库(Cloud data warehouses,CDW)得到了广泛的应用并飞速发展。同时,CDW不但能够存储比本地数据库更多的数据,而且可以通过现代化数据管道,简化了ETL的各种流程,因此许多企业都开始用[详细]
-
美团图神经网络训练架构的实践和探索
所属栏目:[大数据] 日期:2022-06-10 热度:117
美团搜索与NLP团队在图神经网络的长期落地实践中,基于业务实际场景,自主设计研发了图神经网络框架Tulong,以及配套的图学习平台,提升了模型的规模和迭代效率。 1. 前言 万物之间皆有联系。图作为一种通用的数据结构,可以很好地描述实体与实体之间的关[详细]
-
转向未来的AI自动化测试工具
所属栏目:[大数据] 日期:2022-06-10 热度:90
近年来,自动化测试已经发生了重大的迭代。它在很大程度上协助QA团队减少了人为错误的可能。虽然目前有许多工具可以被用于自动化测试,但合适的工具一直是自动化测试成败与否的关键。同时,随着人工智能、机器学习和神经网络在各个领域的广泛运用,面向人[详细]
-
微型机器学习有望让深度学习嵌入微处理器
所属栏目:[大数据] 日期:2022-06-10 热度:105
深度学习模型最初的成功归功于拥有大量内存和GPU集群的大型服务器。深度学习的前景催生了一个为深度神经网络提供云计算服务的行业。因此,在几乎无限的云资源上运行的大型神经网络变得非常流行,这对于具有充足预算的科技公司尤其如此。 但与此同时,近年[详细]
-
人工智能平台计划中的质量工程设计
所属栏目:[大数据] 日期:2022-06-10 热度:193
我们正处在人工智能的黄金时代。人工智能方案的采用使得企业更具创造性、竞争力和快速响应能力。软件即服务(software-as-a-service,SaaS)模式,加上云技术的进步,使软件生产和消费过程越来越成熟。 普遍存在的一个事实是,大多数组织更喜欢购买现成的[详细]
-
开启元宇宙的数字人之行
所属栏目:[大数据] 日期:2022-06-10 热度:133
作为构建元宇宙内容的基石,数字人是最早可落地且可持续发展的元宇宙细分成熟场景,目前,虚拟偶像、电商带货、电视主持、虚拟主播等商业应用已被大众认可。在元宇宙世界中,最核心的内容之一非数字人莫属,因为数字人不光是真实世界人类在元宇宙中的化身[详细]
-
使用机器学习重塑视频中的人脸
所属栏目:[大数据] 日期:2022-06-10 热度:63
来自于中、英两国的一项合作研究设计出了一种在视频中重塑面孔的新方法。该技术可以扩大和缩小面部结构,同时还具有高度一致性,并且没有人工修剪的痕迹 一般而言,这种面部结构的转化通过传统的 CGI 方法来实现,而传统的 CGI 方法依托详细且昂贵的运动封[详细]
-
由于智能数据库的自助式机器学习
所属栏目:[大数据] 日期:2022-06-10 热度:66
由于智能数据库的自助式机器学习 1.如何成为一个IDO? IDO(insight-driven organization)指洞察力驱动(以信息为导向)的组织。要成为一个IDO,首先需要数据以及操作和分析数据的工具;其次是具有适当经验的数据分析师或数据科学家;最后还需要找到一种技术或者[详细]
-
元宇宙在艺术领域的探索
所属栏目:[大数据] 日期:2022-06-10 热度:176
在元宇宙概念火爆的当下,各行业均开始了在这片富地中的探索。而在诸多行业之中,艺术行业与元宇宙的融合互促效果尤为明显。在不久前MetaCon元宇宙技术大会上,触角科技有限公司联合创始人、大有不言文化有限公司创始人谷强为我们带来了《元宇宙在艺术行业[详细]
-
几时使用机器学习
所属栏目:[大数据] 日期:2022-06-09 热度:197
为什么要探讨这个话题 探讨这个话题的本质原因是来源于为客户提供数据战略咨询服务时的思考,很多客户的痛点与诉求看似可以用机器学习解决,但实际上却充满风险,所以究竟机器学习什么时候该用,什么时候不该用,便成为了思考的对象。 机器学习起源于学术[详细]
-
如何让程序员更简单使用机器学习
所属栏目:[大数据] 日期:2022-06-09 热度:93
一直以来,人们试图手工编写算法来理解人工生成的内容,但是成功率极低。例如,计算机很难掌握图像的语义内容。对于这类问题,AI科学家已经尝试通过分析汽车、猫、外套等低级像素来解决,但结果并不理想。尽管颜色直方图和特征检测器在一定程度上发挥了作[详细]
-
如何建造一支高效率的人工智能团队?
所属栏目:[大数据] 日期:2022-06-09 热度:104
本文将介绍把机器学习基础设施、员工和流程融合的方式,以实现适用于企业的MLOps(面向人工智能系统的运维管理)。本文希望对旨在以高效人工智能团队开发强大的人工智能/机器学习(AI/ML)项目的经理和主管提供启发。 本文的经验来自Provectus公司的人工智能团[详细]
-
从开始懂互联网到懂用户,谷歌这次都押了哪些宝?
所属栏目:[大数据] 日期:2022-06-09 热度:189
谷歌 I/O 大会如约而至。谷歌 I/O 2022 大会开幕式上,谷歌 CEO Sundar Pichai 发表了长达 2 小时的以知识和计算为关键词的主题演讲。这次演讲在勾勒谷歌长期发展愿景的同时,也在某种程度上描绘后疫情时代的互联网技术的演进方向。 搜索再定义:Anyway、A[详细]
-
线下零售要怎么构建AI自动结账服务?
所属栏目:[大数据] 日期:2022-06-09 热度:74
客户体验是线上零售的重要优势,无需排队、没有延迟、采购便捷。但根据Forrester研究报告,由于人们希望在购买前充分了解产品,或只是不喜欢等待商品运输的过程,美国72%的零售消费仍然依靠实体店面。 目前,无人售货的创意方案在亚马逊无人便利店(Amazon[详细]
-
赋能元宇宙 启动智能交互新未来
所属栏目:[大数据] 日期:2022-06-09 热度:119
MetaCon元宇宙技术大会2022在线上成功举办,大会聚焦元宇宙产业政策、学术研究成果、技术创新和行业落地等多个层面。人机交互与高效能网络落地专场特邀了多名技术大咖,针对如何实现元宇宙世界人机交互,VR/AR/MR虚拟现实技术、全息影像技术、传感技术等常[详细]
-
互联网 VS 传统行业,数据分析有啥异同
所属栏目:[大数据] 日期:2022-06-09 热度:148
很多同学好奇:总说互联网数据分析,到底啥是互联网数据分析?和传统企业有啥区别?今天系统讲解下。 典型的传统企业 典型的传统企业,以制造业为代表的,商业模式是: 进原料,生产成产品 通过经销商,卖到全国 承担产品的售后、服务工作 因此,其部门划分[详细]
-
一文看懂渠道分析怎样做
所属栏目:[大数据] 日期:2022-06-09 热度:153
今天跟大家分享的是:推广渠道分析。推广渠道是推广产品、获取客户的途径,对企业而言,是影响收入的重要因素。今天就简单分享一下,该如何进行分析。 一、有哪些推广渠道 凡是能打广告,拉来用户的地方,都是推广渠道。 常见的线上推广渠道,如: 广告:[详细]
-
五种比较常用格式的数据输出,手把手教你用Pandas实现
所属栏目:[大数据] 日期:2022-06-09 热度:51
五种比较常用格式的数据输出,手把手教你用Pandas实现 01 CSV DataFrame.to_csv方法可以将DataFrame导出为CSV格式的文件,需要传入一个CSV文件名。 复制 df.to_csv(done.csv) df.to_csv(data/done.csv) # 可以指定文件目录路径 df.to_csv(done.csv, index=[详细]
-
大数据算法天花乱坠的时代,如何辨别数据陷阱?
所属栏目:[大数据] 日期:2022-06-09 热度:111
过去的一周,你心情咋样? 除了股票基金过山车般的涨跌之外,工作例会上,你使用的数据PPT模板让展示更加美观有趣,获得老板好评。 一把游戏结束,系统自动送上战力统计,你的队友明显拖了后腿,下次不要和ta组队了。 此时手机又提醒你视屏时间过长,建议休[详细]