开源项目分享增强图像数据实现
文末免费送电子书:七月在线干货组最新 升级的《名企AI面试100题》免费送!
项目一:igel — 无需编写代码即可训练,测试和使用模型
一个令人愉悦的机器学习工具,可让您无需编写代码即可训练/拟合,测试和使用模型。
该项目的目标是为技术用户和非技术用户提供机器学习。
有时我需要一个工具,可以用来快速创建机器学习原型。是构建概念验证还是创建快速草图模型来证明这一点。我发现自己经常被困在编写样板代码和/或想太多如何启动它。
因此,我决定创建igel。希望它将使技术和非技术用户更轻松地构建机器学习模型。
igel建立在scikit-learn之上。它提供了一种无需编写任何代码即可使用机器学习的简单方法。
您所需要的只是一个yaml(或json)文件,您需要在其中描述您要执行的操作。而已!
Igel支持sklearn的所有机器学习功能,无论是回归,分类还是聚类。准确地说,您可以在igel中使用63种不同的机器学习模型。
Igel支持数据科学领域中最常用的数据集类型。例如,您的输入数据集可以是您要获取的csv,txt,excel表格,json甚至是html文件。所有这些类型均受igel支持。在后台,igel使用熊猫读取您的输入数据集并将其转换为数据框。
项目的点:
- 从GUI使用
- 支持大多数数据集类型(csv,txt,excel,json,html)
- 支持所有最新的机器学习模型(甚至是预览模型)
- 支持不同的数据预处理方法
- 在编写配置时提供灵活性和数据控制
- 支持交叉验证
- 支持两种超参数搜索(版本> = 0.2.8)
支持yaml和json格式
支持不同的sklearn指标以进行回归,分类和聚类
支持多输出/多目标回归和分类
支持多处理并行模型构建
支持模型:
项目地址:
https://github.com/nidhaloff/igel
薅羊毛啦!七月在线【AI提升季】,【机器学习集训营】【推荐系统高级小班】【CV高级小班】【推荐系统入门】【深度学习入门】【机器学习入门】六大集训营、高级小班课程限时免听!
另外参与活动还可获得:机械键盘、SSD硬盘、七月VIP、AI经典纸质书等,100%有奖!
活动主会场: https://www.julyedu.com/active/assistance/AItisheng
项目二:zindi_wheat_growth — CGIAR小麦生长阶段挑战赛的第一名解决方案
问题是根据农民发送的图像估算小麦作物的生长阶段。模型必须获取图像,并以1(仅显示作物)到7(成熟作物)的比例输出显示的小麦生长阶段的预测。
数据集具有两组标签:不良和良好的质量,但是测试数据集仅由高质量的标签组成。首先,不良标签和良好标签之间没有明确的对应关系(良好标签仅包含5个类别:2、3、4、5、7)。
其次,使用简单的二进制分类器可以轻松地区分劣质图像。因此,它们来自不同的分布。查看这种模型的Grad-CAM可以发现,两组图像之间的主要区别在于这些白棒(极):
这就是训练过程包括两个步骤的原因:
- 结合不良和优质标签对模
- 原文作者:知识铺
- 原文链接:https://geek.zshipu.com/post/%E4%BA%92%E8%81%94%E7%BD%91/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE%E5%88%86%E4%BA%AB%E5%A2%9E%E5%BC%BA%E5%9B%BE%E5%83%8F%E6%95%B0%E6%8D%AE%E5%AE%9E%E7%8E%B0/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com