小说 青春文学 中国散文 外国散文 悬疑推理 文学理论 文集 世界名著
外国小说| 中国当代小说| 中国古典小说| 中国近现代小说| 悬疑推理| 科幻小说 世界名著 四大名著| 作品集| 更多
外国诗歌| 中国古诗词| 中国现当代诗歌| 外国散文| 中国现当代散文| 中国古代散文 文学理论| 文集| 戏剧| 更多
玄幻/科幻| 悬疑/惊悚| 叛逆/成长| 爆笑/无厘头| 校园| 港台青春文学| 外国青春文学 更多
历史 哲学/宗教 社会科学 政治军事 传记 文化 古籍 管理 经济 成功励志 法律 语言文字
中国史| 世界史| 地方史志| 历史知识读物| 史料典籍| 史学理论| 考古文物 民族史志
政治| 军事| 中国政治| 国际政治| 外交/国际关系 哲学| 宗教| 美学 哲学知识读物| 中国古代哲学
历代帝王| 历史人物| 科学家| 体育明星| 文学家| 学者| 艺术家| 文娱明星 政治人物| 自传| 更多
世界文化| 中国文化| 中国民俗| 地域文化| 文化理论| 文化评述| 神秘现象
心理学| 人类学| 教育| 社会学| 新闻传播出版| 语言文字| 更多
古籍整理| 经部| 史类| 子部| 集部
经济理论| 中国经济| 国际经济| 经济通俗读物| 保险| 会计| 金融投资 市场营销| 管理学| 电子商务
成功激励| 口才演讲| 名人励志| 人际交往| 人生哲学| 心灵修养| 性格习惯 更多
法的理论| 法律法规| 国际法| 经济法| 更多
中国儿童文学 外国儿童文学 科普读物 绘本 动漫/卡通 幼儿启蒙
中国儿童文学| 外国儿童文学| 童话| 小说| 寓言传说|
动漫/卡通
科普| 百科| 历史读物| 生活常识| 益智游戏| 传统文化
幼儿启蒙| 少儿英语| 励志/成长| 艺术课堂
0-2岁| 3-6岁| 7岁及以上
绘画 书法篆刻 艺术理论 摄影 音乐
绘画理论| 国画| 油画| 素描速写| 水粉水彩
碑帖| 技法教程| 书法理论| 硬笔书法| 字帖| 篆刻
设计| 摄影后期| 摄影教程| 摄影理论| 摄影器材| 数码摄影| 作品集
影视理论| 影视赏析| 影视制作| 舞台/戏曲艺术
钢琴| 吉它| 理论/欣赏| 声乐| 通俗音乐| 外国音乐| 中国民族音乐| 作曲/指挥
宝石| 雕品| 古代家具| 钱币| 收藏百科| 收藏随笔| 书画| 陶瓷| 玉器
艺术理论| 雕塑| 工艺美术| 建筑艺术| 民间艺术| 人体艺术| 艺术类考试
美食 保健/心理健康 旅游 家庭教育 家居休闲
饮食文化| 保健食谱| 家常食谱| 八大菜系| 餐饮指南| 世界美食| 更多
健康百科| 健身| 心理健康| 中老年| 中医保健 常见病| 更多
旅游随笔| 旅游攻略| 旅游画册| 城市自助游| 国内自助游| 国外自助游| 地图地理 更多
孕产百科| 育儿百科| 更多
美丽妆扮| 两性关系| 家居休闲| 个人理财
中小学教辅 外语 教材 医学 计算机 自然科学
语文阅读| 拓展读物| 高考| 初中通用| 高中通用| 工具书 教师用书| 更多
英语读物| 职业英语| 英语考试| 大学英语| 少儿英语 更多
研究生/本科/专科教材 | 职业技术培训| 中小学教材|
操作系统/系统开发| 数据库| 信息安全 程序设计| 电脑杂志| 计算机教材| 计算机考试认证 计算机理论| 计算机体系结构| 家庭与办公室用书| 企业软件开发与实施| 人工智能 软件工程/开发项目管理|
考试| 家庭教育| 自然科学| 科普读物| 医学| 农林业| 工业技术| 建筑
笔记本 布艺品 书签/藏书票
笔记本| 布艺品| 书签/藏书票| 明信片| 笺纸| 胶带| 其它
本书全面而详细地讲述了关于数据仓库每一个重要部分的内容,包括计划、需求、体系、基础、结构、设计、数据准备、信息传递、配置和维护等。本书编排合理,每章提供本章主题,本章小结,可以使读者将每一个概念和技术同数据仓库的实践和市场结合起来;还提供复习思考题和练习供读者巩固学习到的知识。总之,本书几乎涵盖了数据仓库领域所有方面的知识,如果你想成为数据仓库领域专家,它是值得一读的。 本书是专门为IT专业人员而量身定做的介绍数据仓库知识的书籍,适合
当下,由于强大的数据挖掘软件平台很容易获得,草率地使用数据挖掘方法和技术将导致挖掘的结果混淆难解。这种失误往往源自盲目使用“黑盒子”方法进行数据挖掘,而最好的避免途径就是使用“自盒子”方法,理解隐藏在软件背后的算法和统计模型结构。 本书分为7章,第l章是对降维方法的介绍,这是数据挖掘技术的一个先决条件;第2章至第6章为经典的数据挖掘算法和技术,包括一元回归模型、多元回归模型、逻辑回归模型、贝叶斯网络分析以及遗传算法,通过实
内容简介:本书共有8章,面向的对象是Excel初学者,从Excel的基本理念开始,用3章的篇幅介绍Excel的基本规则和基础表单的标准化和规范化,这是极其重要的,任何一个Excel小白都不能跨过这一步!即使已经有了所谓Excel基础的人,很后还是要从头来重新打基础。然后是Excel常用工具、函数和透视表的基本应用的介绍,以及如何利用这些工具技能来解决实际问题...
Alluxio 这一以内存为中心的分布式虚拟文件系统,很初诞生于加州大学伯克利分校的 AMPLab,其开源社区在目前大数据生态系统中发展很快。本书以广泛使用的 Alluxio 1.8.1 版本为基础进行编写,是一本全面介绍 Alluxio 相关技术原理与实践案例的书籍。本书主要内容包括 Alluxio 系统快速入门、Alluxio 系统架构及读写工作机制、Alluxio 与底层存储系统的集成、Alluxio 与上层计算框架的集成、Al
本书共有8章, 面向的对象是Excel初学者, 从Excel的基本理念开始, 用3章的篇幅介绍Excel的基本规则和基础表单的标准化和规范化, 这是极其重要的, 任何一个Excel小白都不能跨过这一步! 即使已经有了所谓Excel基础的人, 最后还是要从头来重新打基础。然后是Excel常用工具、函数和透视表的基本应用的介绍, 以及如何利用这些工具技能来解决实际问题...
《谈谈大数据的那点事》是一本关于大数据的妙趣横生的科普读物。全书分三部分:一部分介绍大数据时代、大数据的内涵、大数据认知的误区,以及大数据的安全性;第二部分介绍一些有趣的案例,大数据与我们生活的关联、大数据带来意想不到的结果、大数据研究与应用的新领域,以及引发的反思;第三部分介绍推动大数据发展的动力、大数据产业发展的一些思考、大数据人才培养与团队建设,以及人工智能与统计学的关系等。 为了让读者更全面、准确而轻松地了解大数据,本书
面对小数据和大数据,数据分析师应该如何收集数据信息?传统的业务框架如何与统计学相关联?测量学扮演着什么角色?建模过程有哪些预分析技术和修正技术?建模工作完成后,如何解析?如何归因?如何预测?等等,这些数据分析能力构成了本书的分析框架。本书分为8章,小数据与大数据分析模式的动态切换贯穿全书,展示了数据分析案例的模块化分析思路。~3章为数据预分析部分,强调业务问题与统计问题的衔接;第4~6章为统计建模阶段,其中附有对行业案例和业务敏感度的
本书以精练的语言介绍HBase的基础知识,让初学者能够快速上手使用HBase,对HBase的核心思想(如数据读取、数据备份等)和HBase架构(如LSM树、WAL)有深入的分析,并且让有经验的HBase开发人员也能够循序渐进地深入理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,使HBase集群响应延迟更低。本书结合企业推荐的“用户行为分析系统”,让读者能够快速上手的同时,也不乏
本书共分为三部分。理论篇重点介绍大数据时代下数据处理的基本理论及相关处理技术,并引入nosql数据库;系统篇主要介绍了各种类型nosql数据库基本知识;应用篇对国内外知名公司在利用nosql数据库在处理海量数据方面的应用做了阐述。本书对大数据时代面临的挑战,以及nosql
本书分为两部分,共10章,从架构到管理,从自动化测试到持续集成,通过丰富的工作实例,系统而深入地讲解敏捷DW/BI的基本原理、关键技术和项目管理实践,为在真实商业智能和数据仓库项目上应用敏捷分析方法提供系统使用指南。从管理角度,详细介绍敏捷分析的基本原则,敏捷项目管理的有效实践,包括章程、规划、执行和检测敏捷分析项目的有效实践,展现如何使用案例和用户故事驱使价值持续传递,并讲解团队管理和领导的敏捷风格如何有效地替代传统命令控制风格;从
本书讲述如何从技术和市场信息特别是专利信息中挖掘获得潜在的竞争情报,从介绍技术挖掘的基础概念、原理开始,讲解数据采集、基本分析、高级分析、趋势分析、专利分析的方法和技巧,给出技术挖掘指标组合,并结合具体案例指出技术挖掘过程中的注意事项,帮助读者了解技术挖掘流程和掌握技术挖掘方法。本书还列出了可供选择使用的科技数据库、技术挖掘软件的资源清单,为有意实际进行技术挖掘的读者提供了指引。 本书可作为技术研究人员,使用技术成果的分析
数据挖掘技术是当下大数据时代最关键的技术,其应用领域及前景不可估量。R 是一款极其优秀的统计分析和数据挖掘软件,本书侧重使用R 进行数据挖掘,重点讲述了R 的数据挖掘流程、算法包的使用及相关工具的应用,同时结合大量精选的数据挖掘实例对R 软件进行深入潜出和全面的介绍,以便读者能深刻理解R 的精髓并能快速、高效和灵活地掌握使用R 进行数据挖掘的技巧。 通过本书,读者不仅能掌握使用R 及相关的算法包来快速解决实际问题的方法,而且能得到从
本书首先综合介绍了内存计算的发展趋势、内存计算的基本概念、内存计算产品和架构。然后从深度上详细介绍了Oracle内存数据库TimesTen,由浅入深,配合实际的操作脚本和源程序,促进和加深读者对TimesTen内存计算架构和特性的理解,并迅速掌握TimesTen内存计算的精髓。...
本书全面总结了不确定数据环境下频繁模式挖掘领域的主要研究成果,从数据模型、问题定义、常用算法等方面系统介绍不确定频繁项集挖掘、不确定序列模式挖掘、不确定频繁子图模式挖掘、不确定高效用项集挖掘和不确定加权频繁项集挖掘技术。重点针对两类典型的不确定数据,即概率数据和容错数据,进行概率频繁模式挖掘和近似频繁模式挖掘的研究,并应用于传统中医药数据环境下,从主观不确定性和客观不确定性两个方面提出相应的解决方案,实现基于不确定数据的高效频繁模式挖
本书基于作者近几年来的研究开发成果及应用实践,对物联网大数据技术体系进行了系统归纳,阐述了物联网环境下感知数据的特性、数据模型、事务模型以及调度处理方法等核心概念及关键技术,并对物联网大数据存储、管理、计算与分析的基本概念和关键技术进行了剖析。本书还介绍了自行研发的面向物联网的ChinDB实时感知数据库系统以及针对云计算环境下物联网大数据管理与应用的DeCloud云平台,介绍了它们在智能交通、智能电厂、教育、安全监控等多个行业的应用。
《企业级大数据平台构建:架构与实现》是一部教你如何从0到1架构与实现一个企业级大数据平台的著作,是作者在大数据和系统架构领域工作超过20000小时的经验总结。作者朱凯从横向视角出发,手把手教你如何拉通Hadoop体系技术栈,以此搭建一个真实可用、安全可靠的大数据平台。通过阅读本书,大家一定能找到灵感和思路来应对实际工作中面对的问题。本书在逻辑上分为三大部分:背景篇(靠前~2章):简单阐述了企业级大数据平台的重要性,并指出了作为一个企业
本书帮你从看流量到看懂流量,从看数据到看懂数据,从了解访客的浏览行为到理解用户的搜索请求。...
本书抽丝剥茧地讲述了云计算简史、大数据的前世今生,纠正了一些时下被误导的观点,分析了大数据与Hadoop的关系、云计算与大数据的关系,从开源vs.闭源的角度阐释了整个业界的软件定义趋势、商用硬件趋势并预言了硬件回归的必然趋势,然后用案例讲解了云计算或大数据系统体系架构的设计与实现。...
本书主要面向商业领域的读者,并基于以下几个关键前提:● 组织机构不需要大数据策略。相比之下,他们需要整合了大数据的商业策略。● 商业领袖将分析方法转化为信息技术的时代已经结束,未来的企业领导者必须将分析方法视为与会计、财务、管理科学和营销一样的商业规则。● 数据货币化和商业转型的关键在于释放机构的创造性思维,必须让企业用户能够像数据科学家一样思考。● *后,大数据的商业潜力只受到企业用户创造性思维的限制。本书的重点即,帮助未来的商业领
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以业务案例为导向,以Power BI桌面版操作为基础进行讲解,深入讲述Power BI在各个业务部门的应用。本书包括7篇共21章内容,分业务场景进行讲解。篇用1章内容讲述Power BI基础操作,方便读者快速入门;第2篇用4章内容讲述如何用Power BI爬取天气、电影、销售、股票等数据;第3篇用4章内容讲述销售部门如何用Power BI分解销售目标,分析业绩达
本文主要包含七部分内容,分别为引言、时序数据约简建模与应用、新型距离测度模型与电力价格突变预测、云特征挖掘模型与电价预测、容差粗集模型与客户信用度分析、电力企业决策支持应用平台实例及结论与展望...
本书主要以OpenTSDB的很新版本(2.3.1版本)为基础进行介绍。章从OpenTSDB的入门开始,介绍市面上多种时序数据库和云端时序数据库,OpenTSDB的基础概念、源码环境搭建及Grafana的基本使用等。第2章主要介绍OpenTSDB的网络层,涉及Java NIO基础、Netty基本使用,分析了OpenTSDB网络层的架构和实现。第3章介绍OpenTSDB中UniqueId组件的原理,主要讲解如何实现UID与字符串之间的映射
本书以emba班的“数据挖掘技术及其应用”教学为场景,带领读者步入数据挖掘的神秘殿堂,领略数据挖掘的神奇魅力。全书分为9章:第1章从三个真实故事开始数据挖掘之旅;第2章以某企业生产中遇到的质量控制难题的解决过程为线索,展现数据挖掘的实施过程;第3章到第9章以典型案例的形式分别介绍了数据挖掘技术在电力行业、交通航空领域、冶金行业、税务与金融行业、电信行业、故障诊断以及互联网行业的应用。 数据挖掘是一种专业性极强的技术,本书避开大
r是一种用于统计计算与做图的开源软件,同时也是一种编程语言,它广泛应用于企业和学术界的数据分析领域,正在成为最通用的语言之一。由于近几年数据挖掘、大数据等概念的走红,r也越来越多地被人关注。截至本文完成之日,cran(http://cran.r-project.org/)上共有4383个包,涉及统计、化学、经济、生物、医学、心理、社会学等各个学科。不同类型的公司,比如google、辉瑞、默克、美国银行、洲际酒店集团和壳牌公司都在
《视频大数据智慧计算方法》可作为大学和研究院所相关专业的教学用书和研究用书,同时还可以供政府部门和企事业单位参考...
本选题以科普的方式系统地阐述了大数据前沿技术与研究进展,对技术的来源、结论、对比、用途以及开源软件进行了深入浅出的描述,并不过多地涉及数学符号及基础原理。以大数据可视化为切入点,通过自然语言处理、社交网络挖掘、语义网络与知识图谱三方面非结构化数据处理技术,阐述大数据经典应用,利用基于图数据库、内存计算、分布式存储系统的大数据存储与管理作为大数据平台支撑,进而探讨基于众包技术扩充数据来源与提高数据质量,并围绕大数据环境下的隐私保护问题,
本书讲述MySQL数据库的开发技术。全书共分为16章,内容包括MySQL发展历史,与其他数据库的区别,MySQL常用的一些工具,MySQL文件结构、系统架构、存储引擎、数据类型,数据库和表的创建、管理和删除,数据完整性约束,包括主键约束、外键约束、非空约束、默认值约束、唯一约束和自增约束等,数据的单表查询和多表查询,视图和索引,变量、常量、运算符和表达式、运算符的优先级、流程控制语句、自定义函数,系统函数,存储过程和触发器,事务管理,
数据科学和大数据分析是指利用数据的力量来发现新的见解。本书涵盖了数据科学涉及的行为广度以及所使用的方法和工具。本书内容侧重于任何行业和技术环境中都会用到的概念、原理和实际应用,并通过开源软件来分析案例,以帮助读者更好地理解。本书将帮助您:成为数据科学团队中的一名贡献者;部署结构化的生命周期方法来分析数据问题;应用合适的分析技术和工具来分析大数据;学习如何用数据来讲一个动人的故事,以推动商业行为;备考emc proven profess
俗话说:“民以食为天。”近几年,食品取代了服装、数码产品等商品门类,成为电子商务的新宠。然而,食品类商品的特殊性抬高了食品网店经营的门槛,让许多卖家对这片“蓝海”望而却步。本书就是为了解决食品卖家在网上开店的困扰而编写的,针对食品类商品的特有属性讲解网店运营的精华要点。全书分10章从市场分析、运营理念、网店注册、搜索引擎优化、店铺装修、推广引流、客户服务、爆款打造、数据化运营这几大关键点入手,对网店运营理论进行了系统的梳理和精辟的总结
本书重点介绍了基础设施运维概念以及如何进行规范操作,实用性高,可操作性强。主要内容如下。第1章总则部分,定义了规程中用到的术语、编写原则、适用范围。第2章对数据中心运维组织、人员、基本制度、运维流程进行了描述。第3~9章重点描述了高低压变配电系统、发电机组、UPS、直流系统、蓄电池组、冷水型制冷系统、直接膨胀式空调、新风自然冷系统、普通空调、制冷自控系统BA、动力环境监控系统、防雷接地系统、综合布线、安防系统和消防系统的维护技术和维护
本书源自作者在斯坦福大学教授的“海量数据挖掘”(cs246: mining massive datasets)课程,第1版上市以来受到读者广泛欢迎和认可。这个新版本在上一版基础上新增三章内容,分别涵盖社会网络图挖掘、降维和大规模机器学习,同时也更新了第1版的部分内容。 众所周知,移动互联网、社交媒体、电子商务和各种传感器的运用产生了超大数据集,挖掘这些数据可以提炼出有用的信息。本书以大数据环境下的数据挖掘和机器学习为重点,全面介绍
网络数据量迅速增大的时代,亟需能高效迅捷分析处理数据的工具,Spark应运而生。本书由Spark开发者及核心成员打造,带领读者快速掌握用Spark收集、计算、简化 保存海量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题...
以商业数据分析为主线,立足互联网工作现实。从如何获取数据到如何在实际工作场景中分析数据,*后以如何完美呈现数据分析的结果为结尾。帮助读者从零进阶,玩转商业数据分析...
网店的运营有其自身的规律和特点,仅有好商品和低价格还远远不够,如果不懂得分析市场、不懂得选择款式、不懂得引流推广、不懂得数据分析、不懂得页面设计,纵然是经营经验丰富的实体店卖家,也会在触网后遭遇水土不服。本书正是为了系统解决网店运营方方面面的问题而编写的。书中几乎每一个小节都可以看成是网店运营的一个问题解决方案,几十个方案汇集在一起就成了一本网店运营宝典,为卖家的电商之路保驾护航。 此外,还赠送超值学习大礼包: 1. 网店管理与运营教
hadoop是目前受关注的大数据处理平台和解决方案,并且已经广泛应用于生产环境。本书基于新的hadoop(cdh5,apache hadoop 2.6)版本介绍hadoop技术的相关知识,不但详细介绍了hadoop、hdfs、yarn、mapreduce、hive、sqoop和hbase等,还深入探讨了hadoop、hbase的运维和性能调优,并包含了一个具有代表性的完整的基于hadoop的商业智能系统的设计和实现。 本书的大特点是
2014年天猫双11购物狂欢节成交额创下了571.12亿元的纪录! 交易创建峰值能力达到每秒钟8万笔,支付宝的支付峰值突破了每分钟285万笔。 成功创下这项纪录背后,有odps很大的功劳! 阿里巴巴集团副总裁刘振飞表示,云计算在今年双11起到了非常重要的基础性作用。天猫、淘宝、支付宝的大数据处理,都是基于阿里云计算的大数据处理平台odps完成,odps为天猫双十一的商品个性化推荐提供了技术支持,这是自主研发能力的一个很大提
本书是站在数据挖掘的独特角度对神经网络、支持向量机和隐马尔可夫理论这三个重要的理论与方法进行重新剖析,并进行方法论基础上的应用,通过讲故事似的生动而系统地阐述数据挖掘的本质,来引领读者对数据挖掘的深入理解和应用...
本书的主要内容有:熟悉Spark的编程模型和生态系统。学习数据科学的一般方法。检查分析大型公共数据集执行步骤的完整性。发现哪些机器学习工具对特定问题有帮助。探索可适应多种用途的代码...
当今社会,大数据技术已广泛应用于各行各业,大数据相关的存储和分布式计算等基本知识也成为了时下大学生尤其是计算机相关专业学生应具备的常识。本书在内容上去繁就简,重点介绍大数据的相关基本概念和原理,包括存储原理和分布式处理的原理。本书主要围绕Hadoop大数据处理平台(第2章),介绍其中涉及的HDFS(第3章)、HBase(第4章)等存储技术和Hadoop MapReduce分布式处理技术(第6章);介绍了大数据相关的存储技术NoSQL数
本书共分为八章,分别为数据分析概述、外部数据的获取、数据处理、函数的应用、数据透视表与数据透视图、数据分析与可视化、Excel数据分析实例、撰写数据分析报告。本书注重平衡理论知识和实践应用,每章都包含了实际应用案例和实训活动,以帮助读者深入理解和掌握所学知识。本书既可作为中等职业院校计算机类专业课程教材,也可作为相关企业培训教材...
编写本书的目的是使读者可以在最z短时间内掌握Excel 数据分析。本书以数据分析的整体流程和知识难易度来安排各章内容及其在全书中的次序,每一章内容都紧密围绕数据分析展开。全书共10 章,每天学习一章,10 天就能学会Excel 中的大多数数据分析工具的用法和技巧。本书的主要内容包括数据分析的基本概念和流程、Excel 中的数据分析工具的功能和特点、导入外部数据和输入不同类型的数据、修复有问题的数据、设置数据格式、排序、筛选、分类汇总、
本书是一套简单而实用的python教程。通过对本书的学习,可以快速入门python,获得大数据获取与分析的基本能力,同时为进一步的专业学习奠定基础、提供帮助。具体来说,希望本书可以让我们快速掌握python网络爬虫方法,对数据进行结构化分析。因此,在内容编排上,本书重在介绍数据获取、分析与建模,侧重于为经管专业学生专业学习服务,而没有过多的介绍python语法,也没有大篇幅地介绍python编程技巧,对这些内容只做必要的基础性介绍。除
实用的python开源模块的大集合; 简单易懂、示例丰富的数据分析教程; 掌握数据可视化、机器学习等高端主题; 新手变身数据分析专家的上好读本...
这是一个“数据为王”的时代,数据驱动“工业4.0”、“互联网+”、“中国制造2025”滚滚前行;数据是企业沉睡的资产,是生生不息的宝藏;只有去认识、去发掘,大数据才能体现巨大的业务价值...
本书邀请了14位国内外大数据产学研有影响力的一线专家学者,总结各自的研究与工作专长,以专题的形式发表了各自的研究成果。本书主要包括了大数据综述、大数据思维、大数据技术与大数据应用四个部分。其中,大数据综述主要介绍大数据的概念、背景、技术与国内外政策等,让读者对大数据有个全景式的了解;大数据思维包括大数据的开放式创新与流动的大数据两方面;大数据技术分别介绍了大数据平台架构、大数据语义分析、情感分析、大数据可视化、多媒体搜索分析等当前的技
本书集结了作者近年来在大数据及其应用领域的研究成果, 针对大数据高效处理问题, 从点排序识别聚类、多标签排序、不平衡数据采样、主动学习、增量学习等方面研究并设计了相关算法。在此基础上, 对大数据环境下电信客户价值评价、客户换机预测和客户流失预测等问题, 设计了相关算法、流程和仿真实验, 并提出了一些合理化的建议, 为大数据分析与在相关行业的应用提供了参考...
《用Python高效操作Excel很简单》由浅入深地介绍如何通过Python语言高效、快捷地操作Excel,从而引领读者高效编写各种能自动生成Excel文件的代码。本书精讲Python操作Excel涉及的大部分知识点,并辅以130多个典型代码示例和2个项目实战案例,从而帮助读者轻松上手并快速提高。 《用Python高效操作Excel很简单》共11章,分为3篇。第1篇基础知识,首先介绍Python开发环境的搭建和配置,然后介绍基本数据类
在数字时代,我们就可以接近相信数据吗对数字的过度依赖,是否会让经济学和人文学视角长期冲突是人类利用量化造福,还是量化用数字局限人类的思维本书是多篇文章的汇编。本书主要讲述了定量分析的弊端,通过对定量分析在实际运用中的分析,指出定量分析在很多时候并不能成为我们做判断的依据。本书肯定了定量分析有价值的部分,同时指出了定量分析的局限性和不正确使用带来的问题,提倡我们在运用中应综合定量分析与定性分析两种方式,根据实际情况进行选择...
《从零开始学Power BI商业数据分析(视频教学版)》从Power BI的基础知识讲起,然后逐步深入Power BI的进阶提升知识,最后配合项目实战案例,展示如何使用Power BI进行数据清洗、数据统计和数据可视化等相关操作,从而帮助零基础的数据分析人员快速上手。 《从零开始学Power BI商业数据分析(视频教学版)》共10章,分为3篇。第1篇基础知识,主要介绍Power BI的下载和注册方法,以及相关组件的用法和数据导入方法,
本书是数据挖掘精髓的浓缩。第1章用通俗易懂的语言回答五个基本的问题, 包括什么是数据, 什么是大数据, 什么是数据挖掘, 以及数据挖掘能挖掘出哪些东西和会产生什么价值。然后用六章的篇幅, 介绍k-均值、k-近邻、朴素贝叶斯、决策树、回归分析和关联规则挖掘六种方法。第8章介绍一些实际的应用, 演示简单的数据挖掘方法如何产生巨大的价值...
《数据科学实战入门使用Python和R》一书将使你深入了解数据科学很流行的两大开源平台:Python和R。 当前数据科学很好热门。Python和R是世界更流行的两个开源数据科学工具。在本书中,你将逐步学习如何使用更优选的技术,针对现实世界的业务问题提供切实可行的解决方案。 本书为没有数据分析和编程经验的读者编写。章专门为初学者讲解Pyhton和R的基础知识。此后的每一章都提供了使用Python和R解决数据科学问题的分步说明和实践演练。
(美)艾玛·克莱因(EmmaCline
梁实秋
林奕含
汪曾祺
老王子
[日]熊田千佳慕著,张勇译
京ICP备09013606号-3京信市监发[2002]122号海淀公安分局备案编号:1101083394
营业执照出版物经营许可证 京出发京批字第直110071