文末免费送电子书:七月在线干货组最新 升级的《名企AI面试100题》免费送!

项目一:EssayKiller_V2 基于开源GPT2.0的初代创作型人工智能

EssayKiller是基于OCR、NLP领域的最新模型所构建的生成式文本创作AI框架,目前第一版finetune模型针对高考作文(主要是议论文),可以有效生成符合人类认知的文章,多数文章经过测试可以达到正常高中生及格作文水平。

框架说明:

  • 基于EAST、CRNN、Bert和GPT-2语言模型的高考作文生成AI
  • 支持bert tokenizer,当前版本基于clue chinese vocab
  • 17亿参数多模块异构深度神经网络,超2亿条预训练数据
  • 线上点击即用的文本生成效果demo:17亿参数作文杀手
  • 端到端生成,从试卷识别到答题卡输出一条龙服务

模型结构:

整个框架分为EAST、CRNN、Bert、GPT-2、DNN 5个模块,每个模块的网络单独训练,参数相互独立。infer过程使用pipeline串联,通过外接装置直接输出到答题卡。

模型亮点:

  • 简单的管道实现在当时较高精度的文本检测。
  • 图像通过FCN处理产生像素级文本缩放地图和几何图形的多个频道。
  • 可旋转的文本框,可以检测文本也可以检测单词。

项目地址:

https://github.com/EssayKillerBrain/EssayKiller_V2

项目二:see-rnn Rnn 一般权重、渐变和激活可视化

Keras 和 TensorFlow 中的 Rnn 权重、渐变和激活可视化 (Lstm 、 Gru 、 Simplernn 、 Cudnn 和所有其他)

特性:

  • 权重、渐变、激活可视化
  • 内核视觉对象:内核、循环内核和偏置显式显示
  • 门视觉对象:门控架构(LSTM、GRU)中的门明确显示
  • 通道视觉对象:显式显示的单元格单元(功能提取器
  • 一般视觉对象:也适用于CNN和其他方法
  • 重量规范跟踪:可用于分析重量衰减

内省是调试、规范和理解神经网络的有力工具。此项目的方法启用:

  • 监视权重和激活进度 - 每个更改epoch-to-epoch、iteration-to-iteration
  • 评估学习效率 - 梯度反传播对层到层的、时间到时间步长的影响
  • 评估层健康 - 神经元的"死亡"或"爆炸"的百分比
  • 跟踪体重衰减 - 各种方案(例如 l2 惩罚)如何影响重量规范

能够回答以下问题:

  • 我的 RNN 是否学习长期依赖关系?» 监控梯度:如果非零梯度每次时间步道流动,则每个时间步有助于学习 -> 即,由此产生的梯度源于对每个输入时间步长的核算,因此整个序列会影响权重更新。因此,RNN 不再忽略长序列的部分,而被迫从它们中吸取教训
  • 我的 Rnn 是否学习独立表示?»监控激活:如果每个通道的输出不同且相互关联,则 RNN 提取了
  • 为什么我有验证损失峰值?»所有:瓦尔尖峰可能源于由于较大的梯度导致的层权重的急剧变化,这将明显改变激活模式;查看详细信息有助于通知更正
  • 我的权重衰减是过度还是不足?»监控权重规范:如果值斜减到许多倍,则衰减可能过大 - 或者,如果没有看到任何效果,则增加衰减

项目地址:

https://github.com/OverLordGoldDragon/see-rnn

项目三:FundamentalAnalysis 全面的基本面分析包

此包从 FinancialModelingPrep 收集来自大型公�