小说 青春文学 中国散文 外国散文 悬疑推理 文学理论 文集 世界名著
外国小说| 中国当代小说| 中国古典小说| 中国近现代小说| 悬疑推理| 科幻小说 世界名著 四大名著| 作品集| 更多
外国诗歌| 中国古诗词| 中国现当代诗歌| 外国散文| 中国现当代散文| 中国古代散文 文学理论| 文集| 戏剧| 更多
玄幻/科幻| 悬疑/惊悚| 叛逆/成长| 爆笑/无厘头| 校园| 港台青春文学| 外国青春文学 更多
历史 哲学/宗教 社会科学 政治军事 传记 文化 古籍 管理 经济 成功励志 法律 语言文字
中国史| 世界史| 地方史志| 历史知识读物| 史料典籍| 史学理论| 考古文物 民族史志
政治| 军事| 中国政治| 国际政治| 外交/国际关系 哲学| 宗教| 美学 哲学知识读物| 中国古代哲学
历代帝王| 历史人物| 科学家| 体育明星| 文学家| 学者| 艺术家| 文娱明星 政治人物| 自传| 更多
世界文化| 中国文化| 中国民俗| 地域文化| 文化理论| 文化评述| 神秘现象
心理学| 人类学| 教育| 社会学| 新闻传播出版| 语言文字| 更多
古籍整理| 经部| 史类| 子部| 集部
经济理论| 中国经济| 国际经济| 经济通俗读物| 保险| 会计| 金融投资 市场营销| 管理学| 电子商务
成功激励| 口才演讲| 名人励志| 人际交往| 人生哲学| 心灵修养| 性格习惯 更多
法的理论| 法律法规| 国际法| 经济法| 更多
中国儿童文学 外国儿童文学 科普读物 绘本 动漫/卡通 幼儿启蒙
中国儿童文学| 外国儿童文学| 童话| 小说| 寓言传说|
动漫/卡通
科普| 百科| 历史读物| 生活常识| 益智游戏| 传统文化
幼儿启蒙| 少儿英语| 励志/成长| 艺术课堂
0-2岁| 3-6岁| 7岁及以上
绘画 书法篆刻 艺术理论 摄影 音乐
绘画理论| 国画| 油画| 素描速写| 水粉水彩
碑帖| 技法教程| 书法理论| 硬笔书法| 字帖| 篆刻
设计| 摄影后期| 摄影教程| 摄影理论| 摄影器材| 数码摄影| 作品集
影视理论| 影视赏析| 影视制作| 舞台/戏曲艺术
钢琴| 吉它| 理论/欣赏| 声乐| 通俗音乐| 外国音乐| 中国民族音乐| 作曲/指挥
宝石| 雕品| 古代家具| 钱币| 收藏百科| 收藏随笔| 书画| 陶瓷| 玉器
艺术理论| 雕塑| 工艺美术| 建筑艺术| 民间艺术| 人体艺术| 艺术类考试
美食 保健/心理健康 旅游 家庭教育 家居休闲
饮食文化| 保健食谱| 家常食谱| 八大菜系| 餐饮指南| 世界美食| 更多
健康百科| 健身| 心理健康| 中老年| 中医保健 常见病| 更多
旅游随笔| 旅游攻略| 旅游画册| 城市自助游| 国内自助游| 国外自助游| 地图地理 更多
孕产百科| 育儿百科| 更多
美丽妆扮| 两性关系| 家居休闲| 个人理财
中小学教辅 外语 教材 医学 计算机 自然科学
语文阅读| 拓展读物| 高考| 初中通用| 高中通用| 工具书 教师用书| 更多
英语读物| 职业英语| 英语考试| 大学英语| 少儿英语 更多
研究生/本科/专科教材 | 职业技术培训| 中小学教材|
操作系统/系统开发| 数据库| 信息安全 程序设计| 电脑杂志| 计算机教材| 计算机考试认证 计算机理论| 计算机体系结构| 家庭与办公室用书| 企业软件开发与实施| 人工智能 软件工程/开发项目管理|
考试| 家庭教育| 自然科学| 科普读物| 医学| 农林业| 工业技术| 建筑
笔记本 布艺品 书签/藏书票
笔记本| 布艺品| 书签/藏书票| 明信片| 笺纸| 胶带| 其它
本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难
“大数据”近年成为IT领域的热点话题,人们每天都会通过互联网、移动设备等产生大量数据。如何管理大数据、掌握大数据的核心技术、理解大数据相关的生态系统等,是作为大数据开发者必须学习和熟练掌握的。本系列书以“大数据开发者”应掌握的技术为主线,共分两卷,以7个模块分别介绍如何管理大数据生态系统、如何存储和处理数据、如何利用Hadoop工具、如何利用NoSQL与Hadoop协同工作,以及如何利用Hadoop商业发行版和管理工具。本系列书涵盖了
本书结合数据科学与大数据技术专业 (本科) 和大数据技术与应用专业 (专科) 的教学需要以及大数据分析爱好者的自学需要, 从大数据和数据科学视角讲解Python编程的基础知识和基本技能, 内容包括: 数据科学实践和大数据分析中常用的知识点, 数据科学实践和大数据分析中常用的编程技巧等...
全书共有15章,分为4篇。基础篇,阐述数据可视化的基础理论和概念,从人的感知和认知出发,介绍数据模型和可视化基础;时空数据篇,介绍带有空间坐标或时间信息的数据的可视化方法,此类数据通过设备在真实物理空间中采集得到或由科学计算模拟产生;非时空数据篇,描述非结构化和非几何的抽象数据的可视化,这些数据既存在于真实物理空间,又是社会空间和网络信息空间的基本表达形式;用户篇,介绍面向各类数据的可视化在实际应用同需要的方法、技术和工具,例如交互和
本书从多个数据项目实例出发,介绍爬虫、反爬虫的各种案例,使读者了解到数据抓取和分析的完整过程。书中案例的难度由浅入深,以作者原创的代码为主,不借助现成的框架,强调在数据采集过程中的发散思维,总结攻克反爬虫的思维模式,实现以低成本的方式得到想要的数据的愿望。很后,用一个“爱飞狗”的例子,为读者展示如何从0到1地开发一个大数据产品...
《大数据测评》一书介绍了大数据的概念和特征,各国大数据发展的战略、发展趋势及其标准化情况,以及对于软件测试带来的挑战。在此基础上,《大数据测评》在面向大数据处理框架、大数据基础算法、应用系统、系统安全和隐私泄露的测评技术等方面展开了分析和讨论。以Hadoop为主线开展大数据测试的探讨。在底层支撑框架层聚焦于单元测试和框架基准测试;在基本算法中涵盖了聚类、分类及其个性化推荐;在应用层,介绍了其性能测试中若干问题,重点阐述数据集的设计与分
适读人群 :想全面学习wireshark的初学者、网络管理员、渗透测试人员、网络安全专家、网络数据分析人士 通过80个实例,详细讲解了wireshark数据包分析实施的8大类技巧 基于wireshark抓取的数据包,层层剥茧地剖析了12种常见网络协议的构成 全面涵盖wireshark基础知识和应用技巧,以及使用wireshark对网络协议进行分析 遵循规范,从专业的角度循序渐进地讲解了wireshark抓包及分析的实施流程 针对海量数
《汇计划在行动》全面介绍了《上海市推进大数据研究与发展三年行动计划(2013-2015年)》的编制和实施过程。系统介绍了对大数据概念、内涵、技术和应用方面的认识,介绍了在上海信息化建设的基础和现状之上,如何让大数据在上海落地,并着力解决大数据应用过程中的关键问题,开展数据科学前瞻研究和人才培养;对三年行动计划进行了全面解读。《汇计划在行动》还介绍了“上海大数据产业技术创新战略联盟”发起、组建、运行方面的情况;介绍了“上海市数据科学重点
本书系统地讨论了大量设计议题、并包括21个设计建议、8个实践建议、7个设计原则、27个通用算法和技术、12个元数据驱动的通用操作符、7个工作过程、4个范式基础及范式原则。内容包括: 绪论、体系结构概要、预备域等...
本书的原创性在于:提出并研究给出了大数据智慧计算原理与方法,具体又提出并研究给出了跳板大数据智慧计算原理与方法、耦合大数据智慧计算原理与方法、先验大数据智慧计算原理与方法、自适应云计算的原理与方法、增量大数据智慧计算原理与方法、自动大数据智慧计算原理与方法、分治大数据智慧计算原理与方法、冗余大数据智慧计算原理与方法...
《生态学数据分析:方法、程序与软件》的特点是操作性强,为生态学、植物学、动物学专业的研究生和科技工作者提供了实用的工具书...
本书共16章,共三篇。基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具MATALB进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过
本书源自作者在斯坦福大学教授的“海量数据挖掘”(cs246: mining massive datasets)课程,第1版上市以来受到读者广泛欢迎和认可。这个新版本在上一版基础上新增三章内容,分别涵盖社会网络图挖掘、降维和大规模机器学习,同时也更新了第1版的部分内容。 众所周知,移动互联网、社交媒体、电子商务和各种传感器的运用产生了超大数据集,挖掘这些数据可以提炼出有用的信息。本书以大数据环境下的数据挖掘和机器学习为重点,全面介绍
大数据是智能革命的核心。大数据背后的基本思想是,人类一切行为都会留下数字痕迹(或数据),我们(或他人)可以对其加以利用,变得更加智慧。掌握数量日益增加的数据并利用技术能力将其转化成具有商业价值的想法,是推动新世界的主要力量。无疑大数据正在改变世界,我们的居住、择偶、治疗癌症、科研、提升绩效、管理城市、治理国家和管理企业的方式都因此而发生完全改变。 本书从如何使用大数据的角度入手,给出了一套详细且可行的分析框架,以简明扼要的方式教会
本书共16章,分三个部分:基础篇、实战篇、提高篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。高级篇介绍了基于R语言二次开发的数据挖掘应用软件,使读者体验到数据挖掘二次的开发的魅力...
本书是一部有关大数据的概述,全书共分五个部分,内容分别是:什么是大数据,大数据的应用,支撑大数据的技术,大数据的执行和应用技术——数据挖掘,大数据应用的未来趋势和挑战...
本书邀请了14位国内外大数据产学研有影响力的一线专家学者,总结各自的研究与工作专长,以专题的形式发表了各自的研究成果。本书主要包括了大数据综述、大数据思维、大数据技术与大数据应用四个部分。其中,大数据综述主要介绍大数据的概念、背景、技术与国内外政策等,让读者对大数据有个全景式的了解;大数据思维包括大数据的开放式创新与流动的大数据两方面;大数据技术分别介绍了大数据平台架构、大数据语义分析、情感分析、大数据可视化、多媒体搜索分析等当前的技
大数据作为一门崭新的学科,尚未形成完整的理论体系,仍存在许多关键问题尚待解决。 本书由业内实力派作者编著,与您一同探寻大数据背后的基础理论与核心技术,并在剖析教育、医疗、金融、交通等典型应用的基础上讨论未来趋势。...
本书深入阐述了图数据管理与挖掘的关键技术和典型应用。内容包括了子图匹配查询处理算法、基于社会网络图数据的推荐方法、时空图挖掘方法、基于专利图数据的专利检索与挖掘方法。同时, 本书也将这些成果分别应用于图数据查询处理系统、社会网络平台、时空数据挖掘系统以及...
冬瓜哥对技术的追求已经到了痴迷的境界,与10年前相比,文笔解析更为到位,技术理解更为精准。其公众号的每篇文章,都是存储业界风向标。...
本书是50个优秀案例的汇编,充分展示了部分先行先试的国内企业在大数据技术、产品、服务以及应用方面的经验和模式,以及取得的初步成效。编者希望通过这种展示方式,为相关地区、行业、企业发展和应用大数据提供有益的借鉴与思考,同时促进政产学研用深度合作,指导和帮助地方、企业和用户加强沟通交流。...
这是一本适合教学和零基础自学的Hadoop与大数据挖掘的教程,即便你完全没有Hadoop编程基础和大数据挖掘基础,根据本书中的理论知识和上机实践,也能迅速掌握如何使用Hadoop进行大数据挖掘。全书主要分为两篇:基础篇(1-7章),首先从宏观上介绍了大数据相关概念和技术,然后逐一对Hadoop、Hive、HBase、Pig、Spark、Oozie等一系列大数据技术的概念、原理、架构,以及企业应用方法进行了详细介绍,同时配有大量的案例。
本书适合: 大数据技术初学者阅读; 作为高等院校计算机相关专业的研究生学习参考资料; 所有愿意对大数据技术有所了解并想要将大数据技术应用于本职工作的读者阅读。...
数据挖掘是一门面向应用的新兴学科分支。本书以各类数据挖掘算法为核心,对数据挖掘研究领域的主要理论和典型算法进行了研究,并注重国内外研究进展的融入,力求内容系统、全面、先进。本书主要内容包括数据挖掘中的数据预处理、数据的存储与数据仓库、关联规则挖掘算法、数据分类和预测挖掘算法、时间序列与序列模式挖掘算法的实现、数据聚类分析算法的实现、复杂类型的数据挖掘算法等。本书结构合理,条例清晰,内容丰富新颖,是一本值得学习研究的著作...
本书系统地介绍了数据挖掘的方法和技术,主要内容包括:决策树挖掘;关联规则挖掘;逻辑回归;神经网络;聚类分析;支持向量机;降维;异常检测等。每一章都会涉及学习要点、学习难点和思考题,希望能使学生对数据挖掘的整体结构、理论、概念、技术和方法有深入的认识和了解;掌握数据挖掘的技术、方法及数据挖掘应用系统开发,了解数据仓库和数据挖掘技术的研究问题、现状及未来的研究方向。并且结合具体案例的分析,实现数据挖掘的功能。希望学生在创新意识、科研能力等
Apache Kylin将传统的数据仓库及商务智能分析能力带入到了大数据时代,作为新兴的技术已经被广大用户所使用。作为创始作者,我非常欣喜能看到关于Apache Kylin相关书籍的出版, 这无疑对中国用户更好地使用Kylin,解决实际的大数据分析架构及业务问题有很大帮助。韩卿Kyligence 联合创始人兼CEO,Apache Kylin项目管理委员会主席(PMC Chair) 伴随着大数据发展的三条主线是大数据技
本书系统地介绍了线性表、栈、队列、串、数组、广义表、树、二叉树、图等常用数据结构以及查找、排序、索引等算法设计技术,给出了较多的数据结构应用实例及其算法在计算机中的存储和实现,分析了复杂度。书中各种算法采用C++语言描述,既适合在MSVC下使用,也适合在MSVC++.NET中使用。全书注重程序设计风格,可读性和实用性强。本书内容丰富,层次清晰,讲解深入浅出,可作为计算机及相关专业本、专科数据结构课程的教材,也可供从事计算机软件开发和应
来自全球20余家知名数据公司的31位数据专家分享了他们在数据化思维、数据治理、BI与数据可视化、数据分析与数据挖掘、大数据应用5大主题下的佳实践...
本书是国内绝大多数高校采用的知名教材《云计算》(1-3版)的姊妹篇,是中国大数据专家委员会刘鹏教授联合国内多位专家历时两年的心血之作。大数据领域一直缺乏一本权威教材,希望本书能够填补空白。本书系统地介绍了大数据的理论知识和实战应用,包括大数据采集与预处理、数据挖掘算法和工具和大数据可视化等,并深度剖析了大数据在互联网、商业和典型行业的应用。刘鹏教授创办的网站中国大数据(thebigdata.cn)、中国云计算(chinacloud.c
本书抽丝剥茧地讲述了云计算简史、大数据的前世今生,纠正了一些时下被误导的观点,分析了大数据与Hadoop的关系、云计算与大数据的关系,从开源vs.闭源的角度阐释了整个业界的软件定义趋势、商用硬件趋势并预言了硬件回归的必然趋势,然后用案例讲解了云计算或大数据系统体系架构的设计与实现。...
《大数据应用启示录》是《物联网应用启示录》的作者联合清华大学数据研究院和清华大学大数据产业联合会共同编写的一本 以案例为核心内容的图书,以近50余个应用案例向读者展示了大数据时代全行业的应用图景,以及依据真实存在的案例,像读者阐述了大数据是如何改变我们的生活。本书超过一半的篇幅是彩色印刷。涵盖了工业、科技、商业、民生四大板块的二十余个行业。集可读性、趣味性、知识性、启发性于一身。Zara的衣服为什么卖得好?农夫山泉在经历了前几年的销售
《数据挖掘在Web资源开发与利用中的应用研究》为国家社科基金后期资助项目成果,针对Web资源开发利用面临的主要问题,围绕数据挖掘优化方法,对用户行为分析、个性化推荐、Web信息检索以及Web页面链接分析等方面的内容展开研究。该成果定性与定量研究、理论与实证研究相结合,融合多个学科的技术成果,在研究方法和手段上有所创新。该成果既有翔实的理论阐述,又有系列的公式演示,严谨可信,具有较高的理论研究价值;同时该成果提出的一些新型模型和理论框架
破除大数据神话 带领我们从云端回到地面 著名传播学者文森特莫斯可关于大数据的批判性力作...
本书是数据挖掘和机器学习领域的经典畅销教材,被国内外众多名校选用。第4版全面反映了该领域的新技术变革,包括关于概率方法和深度学习的重要新章节。此外,备受欢迎的机器学习软件Weka再度升级,读者可以在友好的交互界面中执行数据挖掘任务。书中的基础知识清晰详细,实践工具和技术指导具体实用,不仅适合作为高等院校相关专业的本科生或研究生教材,也可供广大技术人员参考...
第2版参考了美国国家标准与技术局对云计算的权威定义,结合作者近期的教学和云计算项目实战经验,对open stack溶入了更多的笔墨。书中涉及的软件和技术全部更新到今天。新增了更多的图片,使得内容更加通俗易懂。结合了读者的反馈意见对章节也做了更好的调整。...
本书共13章,主要内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用Hive进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、H
近距离行业洞察,35年行业积累,20例深度揭秘;本书的主编卢朝霞女士,作为东北大学的资深教授,我国大健康和信息化领域著名的专家学者,以及东软集团的高级副总裁,她既具备非常深厚的专业背景和理论功底,同时也拥有数十年所积累的非常丰富的企业实践经验。...
本书根据教育部高等学校计算机基础教学指导委员会编制的《普通高等学校计算机基础教学基本要求》,为满足高等教育对数据库技术和程序设计方面的基本要求进行编写。 本书共11章,包括数据库基础知识、Access 2013数据库、表的创建与使用、查询设计、结构化查询语言SQL、窗体设计、报表设计、宏、VBA与模块、数据库管理、数据库安全。书中有丰富的案例和大量的练习题、上机实训,还提供课后习题参考答案。 本书内容叙述清楚、示例丰富、图文并茂、步骤
本书对经典物理学各个领域的齐次和非齐次波动方程的解的数学结构进行了深刻的揭示,理论成果对工程技术若干领域有用。本书对若干领域用数学特别是场论的方法进行一些探索,初步形成一家之说。本书采用现象学的基本观点和方法,道说追求真理的乐趣、途径和过程;展示作者方法的直观、必然和优雅。本书可供电磁理论、应用数学、线性声学、固体力学、地球物理、应用物理、微波遥感、材料科学、光电子学等专业的科技人员、研究生、大学生阅读和参考,也可作为相应专业研究生有
作为数据仓库和商业智能(DW/BI)行业中最有影响力的领军人物,Ralph Kimball、Margy Ross得到了世界范围内的认可和尊重,他们在《数据仓库与商业智能宝典(第1版)》中确立了行业标准。现在,在《数据仓库与商业智能宝典(第2版) 成功设计、部署和维护DW/BI系统》中已经更新了65篇DesignTip和白皮书,从而汇集了DW/BI技术创新前沿的著作。 从项目规划和需求收集,到维度建模、ETL和BI应用,本书涵盖了你
本书内容详实而富有实际指导价值, 通过本书, 软件开发者和架构师将学到如何将这些原则用于实践, 如何在最新应用架构中充分发挥数据的威力。内容包括: 数据系统基础 ; 分布式数据系统 ; 派生数据...
本书是一本面向Lua程序员和脚本语言爱好者的语言自制指南和实战宝典。作者融合自己丰富的工程实践经验,详细阐述Lua语言的核心语法和实现原理,深入探讨Lua虚拟机、编译器和标准库,并给出了实际可以编译执行的代码。助你从零基础开始编程实现Lua语言,有效理解脚本语言工作原理。全书分为3个部分,共21章。靠前部分主要讨论LuaAPI和虚拟机实现,包括二进制chunk格式、Lua虚拟机指令集、元编程、错误处理等。第二部分主要讨论Lua语法和编
本书针对MongoDB和Redis这两个主流的NoSQL数据库编写,采用“理论+实践”的形式编写,共计45个实例。全书共分为4篇:篇,介绍了什么是NoSQL、MongoDB和Redis相对于传统关系型数据库的优势;第2篇,介绍了MongoDB与Redis的安装方法和基础操作,并使用员工信息管理系统和聊天室网站实践MongoDB和Redis。第3篇,介绍了MongoDB与Redis的不错语法和应用;第4篇,使用MongoDB与Redis
《数据仓库(原书第4版)》详尽地讲述了数据仓库的基本概念、基本原理,以及建立数据仓库的方法和过程。主要内容包括:决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、EIS系统和数据仓库的关系、外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与Web、ERP与数据仓库以及数据仓库的复查要目。 《数据仓库(原书第4版)》是数据仓库的创始人撰写的关于数据仓库的著作,这个新版本收录
本书主要介绍大数据可视化的基本概念和相应的技术应用。全书内容共10章,分别为大数据可视化概述、大数据可视化原理、大数据可视化方法、数据可视化工具、Excel数据可视化、Tableau数据可视化、ECharts与pyecharts数据可视化、Python数据可视化、大数据可视化行业分析以及大数据可视化综合实训。 本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据分析的相关技术,并且对于书中重要的、核心的知识点加大练
《IBM SPSS数据分析实战案例精粹(第2版)》以IBM SPSS Statistics 24为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,详细讲解了整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,使读者在阅读时能突破方法和工具的,真正聚集于对数据分析精髓的领悟。本书还一并提供案例数据的下载,读者可完整重现全部的分析内容。 《IBM SPSS数据分析实战
本书基于 Spark 2.4.X版本,以 Spark商业案例实战和 Spark在生产环境下几乎所有类型的性能调优为核心,以 Spark内核解密为基石,对企业生产环境下的 Spark商业案例与性能调优抽丝剥茧地进行剖析。全书共分 4篇,内核解密篇基于 Spark源码,从一个实战案例入手,循序渐进地全面解析 Spark 2.4.X版本的新特性及 Spark内核源码;商业案例篇选取 Spark开发中拥有代表性的经典学习案例,在案例中综合介绍
本书内容围绕股票大数据分析技术展开,主要介绍从不同角度对股票数据进行深度分析并用于实战的方法。 本书首先介绍股票的基本知识以及传统的基本面和技术面分析方法; 之后在每章中结合不同的数据源,从不同角度对股票进行深度分析,介绍相关的数据挖掘算法; 针对数据的特点,提出新的分析思路和计算方法; 结合新方法在股票挖掘平台上的实现对股票的操作进行实战解析。具体内容包括: 基于技术分析指标的买卖点计算方法; 股票时间序列的特征表示方法; 聚类算法
本书全面介绍了文本情感分析领域的主要研究问题,包括情感词典自动构建,主客观分类,篇章、句子、属性等不同层级的情感分类,跨领域情感分类,跨语言情感分类,情绪分析理论和情绪分类,以及结合情感的文本摘要与观点检索研究等。同时,还对情感分析与观点挖掘研究领域的公开资源进行了整理与归纳。本书重在对情感分析和观点挖掘研究的主流方法和前沿进展进行概括、比较和分析,适用于该领域高校科研院所的研究参考,也可以作为企业和政府对该领域的实际应用的指导...
高价值、低密度是大数据的特征,挖掘高价值、低密度的数据对象是大数据的一项重要工作。特异群组是一类高价值、低密度的数据形态,是指在众多行为对象中,少数对象群体具有一定数量的相同(或相似)的行为模式,表现出相异于大多数对象而形成的异常的群组。特异群组挖掘在证券金融、医疗保险、智能交通、社会网络和生命科学研究等领域具有重要的应用价值。对特异群组挖掘的研究代表了数据挖掘从浅层到深层的发展趋势和必要性。 本书系统地阐述了特异群组挖掘任务,包括介
这是一本没有编程基础也能学习的企业数据分析书。本书以解决企业中常见的数据分析问题为主线,通过实例,采用“思路―方法―具体实现过程”的结构进行通俗易懂的讲解。本书共分为3 篇。 篇,带领读者了解数据分析并熟悉3 个很常用的数据分析工具――SPSS Modeler、Power BI 和MySQL。也许你之前都没有听说过SPSS Modeler 和Power BI,但请不要担心,它们真的很容易上手。第2 篇商品分析,介绍了企业中两个典型的分
SPSS是一款经典流行的统计分析软件,完全适合作为各行业进行数据挖掘和数据分析的工具。全书内容共12章,书中第1~2章介绍SPSS的基本界面和窗口操作、调查研究、SPSS数据整理与数据挖掘的基本知识;第3~12章采用10个典型应用的综合案例分别介绍以SPSS 250版本在数据挖掘和数据分析中的具体应用。 本书内容由浅入深、循序渐进、结构安排合理,企业中的经营预测者与决策者、财会人员、市场营销人员、生产管理等部门的工作者、经济管理部门
刘争争
泰戈尔
阎连科
吴晗 著
[英]蕾秋·乔伊斯 著,焦晓菊 译
林奕含
京ICP备09013606号-3京信市监发[2002]122号海淀公安分局备案编号:1101083394
营业执照出版物经营许可证 京出发京批字第直110071