代码拉取完成,页面将自动刷新
同步操作将从 DataManagement/Spark-Autotuning 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
Apache Spark是一个流行的开源的分布式数据处理平台,它使用分布式内存抽象模型来对分布在集群内存中的数据进行高效地处理。 Apache Spark的性能表现受到配置参数的影响,这些参数的调优往往由人力完成,然而不适当的参数配置可能严重地降低系统的性能表现。 本工具能够根据历史记录自动调整Apache spark的参数设置
.
├── conf
│ ├── HIT_tiny_cluster_SearchDistrict.json
│ └── netWorkConf.json
├── LICENSE
├── historyDataWhenDBnotAvaliable
│ ├── Application_Record_418aad6c2653113c77fc9eae20f15af8_cn.ac.ict.bigdatabench.Sort.data
│ ├── Application_Record_464af204c579b99b3665667fc2a82611_KmeansAppJava.data
│ ├── Application_Record_96b59fd590cd7eda7ab0481505b62e89_src.main.scala.pagerankApp.data
│ └── Application_Record_f997016922b609ede885f609f1f3d484_LogisticRegression.src.main.java.LogisticRegressionApp.data
├── PythonFiles
│ ├── daemon_fromDB.py
│ ├── daemon_from_File2.py
│ ├── dataFileReader.py
│ ├── DBReader.py
│ ├── MLModels.py
│ ├── trainModelFromData2_only_use_SVM.py
│ ├── trainModelFromData2.py
│ └── trainModelFromDB.py
└── src
├── confs
│ ├── DataType.java
│ ├── ParameterGroup.java
│ └── SingleParameter.java
├── fetcher
│ ├── APIFetcher.java
│ ├── HTTPWebFetcher.java
│ ├── RDDInfo.java
│ ├── RunRecord.java
│ ├── SparkConfiguration.java
│ ├── StageInfo.java
│ └── TaskInfo.java
├── FileIO
│ └── OutPutFile.java
├── gradientDescent
├── graybox
│ ├── CallPythonWindows.java
│ ├── GrayBoxConf.java
│ ├── ParameterDistrict.java
│ └── ParameterSearch.java
├── huristic
│ ├── Estimator.java
│ ├── HuristicConf.java
│ ├── StandAloneResourceEstimator.java
│ ├── yarnResourceEstimator.java
│ └── zlocal_test.java
├── mysql
│ ├── DataFile.java
│ └── DB.java
├── others
│ ├── DataType.java
│ └── Global.java
├── shellInterface
│ ├── LinuxShell.java
│ ├── OSinfo.java
│ ├── OSType.java
│ ├── Temp.java
│ └── UserSubmitInterface_test.java
└── tools
└── DummyRecordGen_test.java
JDK 1.8.0
Hadoop:2.7.0
Spark :2.1.0 (on yarn 模式)
Python 2.7.0
请确保python已经安装以下版本的包
MySQL-python 1.2.5
numpy 1.13.1
Pillow 4.2.1
scikit-learn 0.18.2
scipy 0.19.1
Java -jar Spark-tune-submit.jar [options] <app jar | python file> [app arguments]
参数字段 | 描述 | 其他 | |
---|---|---|---|
Spark-tune-submit.jar | 优化模块程序包 | ||
[options] | Spark原生系统的选项,如参数,运行模式等 | 可选 | |
<app jar 或 python file> | 用户向系统提交的可执行文件,可以是jar包或python 脚本。 | 需要使用绝对路径 | |
[app arguments] | 用户提交的jar包或者python 脚本的输入参数。 | 可选 |
目前还有部分代码因为论文原因没有全部上传
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。