文末免费送电子书:七月在线干货组最新 升级的《名企AI面试100题》免费送!

项目一:igel — 无需编写代码即可训练,测试和使用模型

一个令人愉悦的机器学习工具,可让您无需编写代码即可训练/拟合,测试和使用模型。

该项目的目标是为技术用户和非技术用户提供机器学习。

有时我需要一个工具,可以用来快速创建机器学习原型。是构建概念验证还是创建快速草图模型来证明这一点。我发现自己经常被困在编写样板代码和/或想太多如何启动它。

因此,我决定创建igel。希望它将使技术和非技术用户更轻松地构建机器学习模型。

igel建立在scikit-learn之上。它提供了一种无需编写任何代码即可使用机器学习的简单方法。

您所需要的只是一个yaml(或json)文件,您需要在其中描述您要执行的操作。而已!

Igel支持sklearn的所有机器学习功能,无论是回归,分类还是聚类。准确地说,您可以在igel中使用63种不同的机器学习模型。

Igel支持数据科学领域中最常用的数据集类型。例如,您的输入数据集可以是您要获取的csv,txt,excel表格,json甚至是html文件。所有这些类型均受igel支持。在后台,igel使用熊猫读取您的输入数据集并将其转换为数据框。

项目的点:

  • 从GUI使用
  • 支持大多数数据集类型(csv,txt,excel,json,html)
  • 支持所有最新的机器学习模型(甚至是预览模型)
  • 支持不同的数据预处理方法
  • 在编写配置时提供灵活性和数据控制
  • 支持交叉验证
  • 支持两种超参数搜索(版本> = 0.2.8)

支持yaml和json格式

支持不同的sklearn指标以进行回归,分类和聚类

支持多输出/多目标回归和分类

支持多处理并行模型构建

支持模型:

项目地址:

https://github.com/nidhaloff/igel

薅羊毛啦!七月在线【AI提升季】,【机器学习集训营】【推荐系统高级小班】【CV高级小班】【推荐系统入门】【深度学习入门】【机器学习入门】六大集训营、高级小班课程限时免听!

另外参与活动还可获得:机械键盘、SSD硬盘、七月VIP、AI经典纸质书等,100%有奖!

活动主会场: https://www.julyedu.com/active/assistance/AItisheng

项目二:zindi_wheat_growth — CGIAR小麦生长阶段挑战赛的第一名解决方案

问题是根据农民发送的图像估算小麦作物的生长阶段。模型必须获取图像,并以1(仅显示作物)到7(成熟作物)的比例输出显示的小麦生长阶段的预测。

数据集具有两组标签:不良和良好的质量,但是测试数据集仅由高质量的标签组成。首先,不良标签和良好标签之间没有明确的对应关系(良好标签仅包含5个类别:2、3、4、5、7)。

其次,使用简单的二进制分类器可以轻松地区分劣质图像。因此,它们来自不同的分布。查看这种模型的Grad-CAM可以发现,两组图像之间的主要区别在于这些白棒(极):

这就是训练过程包括两个步骤的原因:

  • 结合不良和优质标签对模