SPARK高级数据分析(影印版) 东南大学出版社 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

SPARK高级数据分析(影印版) 东南大学出版社电子书下载地址
- 文件名
- [epub 下载] SPARK高级数据分析(影印版) 东南大学出版社 epub格式电子书
- [azw3 下载] SPARK高级数据分析(影印版) 东南大学出版社 azw3格式电子书
- [pdf 下载] SPARK高级数据分析(影印版) 东南大学出版社 pdf格式电子书
- [txt 下载] SPARK高级数据分析(影印版) 东南大学出版社 txt格式电子书
- [mobi 下载] SPARK高级数据分析(影印版) 东南大学出版社 mobi格式电子书
- [word 下载] SPARK高级数据分析(影印版) 东南大学出版社 word格式电子书
- [kindle 下载] SPARK高级数据分析(影印版) 东南大学出版社 kindle格式电子书
寄语:
新华书店正版,关注店铺成为会员可享店铺专属优惠,团购客户请咨询在线客服!
内容简介:
网络数据量迅速增大的时代,亟需能高效迅捷分析处理数据的工具,Spark应运而生。本书由Spark开发者及核心成员打造,带领读者快速掌握用Spark收集、计算、简化保存海量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。
书籍目录:
Foreword
Preface
1.Analyzing Big Data
The Challenges of Data Saence
Introduang Apache Spark
About This Book
2.Introduction to Data Analysis with Scala and Spark
Scala for Data Scientists
The Spark Programming Model
Record Linkage
Getting Started: The Spark Shell and Spark Context
Bringing Data from the Cluster to the Client
Shipping Code from the Client to the Cluster
Structuring Data with Tuples and Case Classes
Aggregations
Creating Histograms
Summary Statistics for Continuous Variables
Creating Reusable Code for Computing Summary Statistics
Simple Variable Selection and Scoring
Where to Go from Here
3.Recommending Music and the Audioscrobbler Data Set
Data Set
The Alternating Least Squares Recommender Algorithm
Preparing the Data
Building a First Model
Spot Checking Recommendations
Evaluating Recommendation Quality
Computing AUC
Hyperparameter Selection
Making Recommendations
Where to Go from Here
4.Predicting Forest Cover with Deasion Trees
Fast Forward to Regression
Vectors and Features
Training Examples
Decision Trees and Forests
Covtype Data Set
Preparing the Data
A First Decision Tree
Deasion Tree Hyperparameters
Tuning Decision Trees
Categorical Features Revisited
Random Decision Forests
Making Predictions
Where to Go from Here
5.Anomaly Detection in Network Traffic with K—means Clustering
Anomaly Detection
K—means Clustering
Network Intrusion
KDD Cup 1999 Data Set
A First Take on Clustering
Choosing k
Visualization in R
Feature Normalization
Categorical Variables —
Using Labels with Entropy
Clustering in Action
Where to Go from Here
6.Understanding Wikipedia with Latent Semantic Analysis
The Term—Document Matrix
Getting the Data
Parsing and Preparing the Data
Lemmatization
Computing the TF—IDFs
Singular Value Decomposition
Finding Important Concepts
Querying and Scoring with the Low—Dimensional Representation
Term—Term Relevance
Document—Document Relevance
Term—Document Relevance
Multiple—Term Queries
Where to Go from Here
7.Analyzing Co—occurrence Networks with GraphX
The MEDLINE Citation Index: A Network Analysis
Getting the Data
Parsing XML Documents with Scala's XML Library
Analyzing the MeSH Major Topics and Their Co—occurrences
Constructing a Co—occurrence Network with GraphX
Understanding the Structure of Networks
Connected Components
Degree Distribution
Filtering Out Noisy Edges
Processing Edge Triplets
Analyzing the Filtered Graph
Small—World Networks
Cliques and Clustering Coefficients
Computing Average Path Length with Pregel
Where to Go from Here
8.Geospatial and Temporal Data Analysjs on the New York City Taxi Trip Data
Getting the Data
Working with Temporal and Geospatial Data in Spark
Temporal Data with Joda Time and NScala Time
Geospatial Data with the Esri Geometry API and Spray
Exploring the Esri Geometry API
Intro to GeolSON
Preparing the New York City Taxi Trip Data
Handling Invalid Records at Scale
Geospatial Analysis
Sessionization in Spark
Building Sessions: Secondary Sorts in Spark
Where to Go from Here
9.Estimating Financial Risk through Monte Carlo Simulation
Terminology
Methods for Calculating VaR
Variance—Covariance
Historical Simulation
Monte Carlo Simulation
Our Model
Getting the Data
Preprocessing
Determining the Factor Weights
Sampling
The Multivariate Normal Distribution
Running the Trials
Visualizing the Distribution of Returns
Evaluating Our Results
Where to Go from Here
10.Analyzing Genomics Data and the BDG Project
Decoupling Storage from Modeling
Ingesting Genomics Data with the ADAM CLI
Parquet Format and Columnar Storage
Predicting Tranion Factor Binding Sites from ENCODE Data
Querying Genotypes from the 1000 Genomes Project
Where to Go from Here
11.Analyzing Neuroimaging Data with PySpark and Thunder
Overview of PySpark
PySpark Internals
Overview and Installation of the Thunder Library
Loading Data with Thunder
Thunder Core Data Types
Categorizing Neuron Types with Thunder
Where to Go from Here
A.Deeper into Spark
B.Upcoming MLlib Pipelines API
Index
作者介绍:
Sandy Ryza,是Cloudera的不错数据科学家,也是Apache Spark项目的活跃贡献者。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
在线阅读地址:SPARK高级数据分析(影印版) 东南大学出版社在线阅读
在线听书地址:SPARK高级数据分析(影印版) 东南大学出版社在线收听
在线购买地址:SPARK高级数据分析(影印版) 东南大学出版社在线购买
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
暂无其它内容!
网站评分
书籍多样性:3分
书籍信息完全性:7分
网站更新速度:5分
使用便利性:9分
书籍清晰度:7分
书籍格式兼容性:8分
是否包含广告:5分
加载速度:9分
安全性:6分
稳定性:7分
搜索功能:4分
下载便捷性:5分
下载点评
- 购买多(524+)
- 内容完整(387+)
- 书籍完整(271+)
- 内涵好书(566+)
- 三星好评(257+)
- 图文清晰(164+)
下载评价
- 网友 龚***湄:
差评,居然要收费!!!
- 网友 马***偲:
好 很好 非常好 无比的好 史上最好的
- 网友 隗***杉:
挺好的,还好看!支持!快下载吧!
- 网友 康***溪:
强烈推荐!!!
- 网友 冉***兮:
如果满分一百分,我愿意给你99分,剩下一分怕你骄傲
- 网友 陈***秋:
不错,图文清晰,无错版,可以入手。
- 网友 扈***洁:
还不错啊,挺好
- 网友 濮***彤:
好棒啊!图书很全
- 网友 孔***旋:
很好。顶一个希望越来越好,一直支持。
- 网友 仰***兰:
喜欢!很棒!!超级推荐!
- 网友 菱***兰:
特好。有好多书
- 网友 谢***灵:
推荐,啥格式都有
- 网友 寿***芳:
可以在线转化哦
喜欢"SPARK高级数据分析(影印版) 东南大学出版社"的人也看了
牛津实用英汉双解词典(全新修订版) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
话剧台词艺术教程 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
老年游法国 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
Gerd消化不良 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
开车去哪儿 京津冀周边自驾游(2016年最新版) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
卡拉马佐夫兄弟(罗翔。认清真实的自我,就不会永远活在平庸里!) 9787532969005 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
Cisco CCNA应考手册 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
SAT核心词汇21天突破 李笑来,岳建辉,张帆 著 外文出版社【正版】 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
Delphi程序设计实训 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
布面精装--人性的优点全集(附码01)-人生金书系列 定价68元 卡耐基、达夫 9787550252226 北京联合出版社 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 江苏公务员考试用书中公2022江苏省公务员录用考试全真题库 申论30套(全新升级) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 民国学术文化丛书 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 能量沙拉 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 【年末清仓】2010考研英语写作秘笈 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 黄冈同步作文小学3年级上册与全新部编版语文教材同步使用老师推荐 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 9787560992228 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 千一的梦象 中国的《苏菲的世界》 故事精彩玄妙 想象丰富奇特 意境开阔宏远 思想气象万千 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 自由电子激光物理导论 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- *诗意的栖居 土人景观手绘作品集(景观与建筑设计系列) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 识古寻踪 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
书籍真实打分
故事情节:8分
人物塑造:7分
主题深度:5分
文字风格:5分
语言运用:7分
文笔流畅:6分
思想传递:3分
知识深度:3分
知识广度:7分
实用性:9分
章节划分:5分
结构布局:7分
新颖与独特:5分
情感共鸣:4分
引人入胜:3分
现实相关:9分
沉浸感:8分
事实准确性:3分
文化贡献:9分