①选定要划分的匿名特征数量N ②依次训练子模型 ③使用子模型做预测,将多个子模型的将结果合并输出到文件中。 ④重新选择N,再重复上述步骤 ⑤xgb和lgb各自重复上述步骤
生成对抗网络 (GAN) 已经展示了一种很有前途的应用,它可以基于与原始真实样本无法区分的大型、高度变化的数据集生成新的数据样本。尽管该应用程序主要关注视觉数据,例如面部或手写字符,但这些方法在工业应用中的使用受到了一定的限制。 这里探索了结合 C-GAN 的自动编码器 (AE) 的应用,用于设计新的 2D 翼型几何形状,其中输入参数将基于升力和阻力系数以及预期的横截面积.
CNN用于机翼升阻比预测 该存储库包含用于实现基于卷积神经网络的翼型升阻比预测方法的数据、代码和结果。该网络模型可以将“翼型轮廓”纳入cnn模型,并预测其“动力学参数”,如升阻比。 ##我们取得的成就(_W):_ **数据预处理:**raw_Data_parsing。py提供了一种将不一致的原始坐标数据转换为维度统一矩阵的方法,这实际上催生了一种新的易于处理的UIUC数据集升级版本。
准备训练数据集,排除全都是缺失值的列。 用LGBMRegressor回归器对数据集进行建模,分p1-p6六个不同模型来建模。 每个模型的建模采用随机5折建模法,得到5个不同模型后对测试集预测取平均值进行模型集成。 p1和p3这两种类别的建模比较难,得到的loss比较大,所以说如果能够有效降低这两个类别的loss,那么结果将会非常好。 模型融合的方法比较有效,能够降低一些loss值。
药物研发是一项成本极高的工作。著名的医学期刊JAMA的一篇调查论文显示,研发一款癌症药物的成本在6.48亿美元左右。其中,大量成本都会用于待选药物分子的测试实验上。虚拟筛选等计算技术可以缩小筛选对象集,降低制药成本,而机器学习技术的出现极大地辅助了计算机辅助药物设计的进步。
Ip2region (2.0 - xdb) 是一个离线 IP 数据管理框架和定位库,支持亿级别的数据段,10微秒级别的查询性能,提供了许多主流编程语言的 xdb 数据管理引擎的实现。