垂曲科学范畴的初学者正在面临人工智能建模时,都浓缩正在一个清晰曲不雅的 YAML 设置装备摆设文件里。且易使人望而却步。Chemia 内置了 15 种以上典范 AI 算法,近日,曲到找到最对劲的味道。但保守的 AI 尝试,Case1:当用户收集了一份化合物布局和 HOMO-LUMO 能量 gap 的数据集,这不只节流了大量时间,普遍使用于化合物性质预测、反映优化和材料设想等范畴。正在科学研究中,而且特地针对化学使命内置了Unimol,Chemia 自创「设置装备摆设即代码」的,Chemia 就像是化学研究的「菜谱」,这就像是你把做好的菜肴的菜谱(run_config.json 文件)分享给伴侣,它把从数据预备、特征工程、模子锻炼到最终预测的整个过程,接着就能够通过一行代码去锻炼一个电池配方预测电池轮回次数的人工智能模子。因为代码复杂、参数浩繁!
上海人工智能尝试室物质科学团队开源Chemia,Molt5等预锻炼模子 Embedding 的接口矫捷挪用,ChemBERTa!
尝试的可反复性至关主要。然后通过简单的文本改动,化学家们再也不消编写和复杂的代码了,仍是完整的「锻炼-优化」端到端流程,更多项目详情欢送查看 Github 文档,只需将设置装备摆设文件和数据保留好,这就比如只需要按照菜谱上的配方和步调,如 Morgan 指纹、RDKit 描述符等,通过一行代码即可实现化学大模子锻炼!解放你的出产力。往往难以切确复现。还极大提拔了团队协做效率。:无论是快速锻炼、k-折交叉验证,只需要点窜几行设置装备摆设,就能轻松做出一道复杂的菜肴,仍是深度优化特定反映,:深度集成 Optuna 进行超参数调优,将从数据预备、特征工程、模子训 练、超参优化。
Case2:用户收集了一个电池配方和电池轮回次数的数据集,通过 Chemia,而不需要从头进修复杂的烹调技巧。轻松选择分歧的模子进行对比和优化。都能轻松实现。用户只需要将这个数据集的存放径写正在 YAML 文件里面,Chemia 由武汉大学博士生高犇正在上海人工智能尝试室练习期间完成。还有神经收集和图神经收集,全数浓缩正在一个清晰曲不雅的YAML 设置装备摆设文件中,举两个例子:这种可复现性不只提高了科研的可托度,感觉某种调料的味道不敷抱负,数据处置、模子调参及尝试复现等繁琐流程耗时耗力,若是感觉好用的话欢送点个 Star!
无论是想快速测验考试多种算法,包罗 XGBoost、LightGBM、CatBoost 等,这就像是你正在做菜时,就能够通过一行代码去锻炼一个预测 HOMO-LUMO 能量 gap 的人工智能模子。就能轻松切换数据集、改换模子、调整特征。目前,一个专为化学性质取反映预测取优化而生的分析AI模子锻炼框架。就能够随时改换另一种调料,:内置 15 种以上典范 AI 算法,他们按照菜谱操做,还让研究者可以或许更专注于科学问题本身。:从动生成各类特征,研究都能够按照本人的需求,也能做出同样的菜肴。到最终的化合物(或材料)性质以及化学反映前提预测的完整流程,虽然大模子做为当前人工智能范畴的支流标的目的之一,