Yellowbrick: Machine Learning Visualization¶
欢迎来到Yellowbrick!
我们最近正在将文档翻译成中文中,请稍后再来。
并且,我们总是在寻求帮助。如果你愿意帮助我们翻译,请向 yellowbrick-docs-zh 提交一个pull request。如果你对支持Yellowbrick感兴趣,请向 codebase 提交一个pull request。
Yellowbrick是由一套被称为"Visualizers"组成的可视化诊断工具组成的套餐,其由Scikit-Learn API延伸而来,对模型选择过程其指导作用。总之,Yellowbrick结合了Scikit-Learn和Matplotlib并且最好得传承了Scikit-Learn文档,对 你的 模型进行可视化!想要更多地了解Yellowbrick,请访问 About 。
如果你第一次接触Yellowbrick,请查看 快速开始 或者直接跳到 模型选择教程 。Yellowbrick是一个丰富的库,并且定期加入多个Visualizers。想要对了解特定Visualizers的更多细节并且扩展对其使用,请前往 Visualizers and API 。如果你想对Yellowbrick作出贡献,请查看 contributing guide 。如果你已经报名参加用户测试,请前往 User Testing Instructions (谢谢!)。
Visualizers¶
Visualizers也是estimators(从数据中习得的对象),其主要任务是产生可对模型选择过程有更深入了解的视图。从Scikit-Learn来看,当可视化数据空间或者封装一个模型estimator时,其和转换器(transformers)相似,就像"ModelCV" (比如 RidgeCV, LassoCV )的工作原理一样。Yellowbrick的主要目标是创建一个和Scikit-Learn类似的有意义的API。其中最受欢迎的visualizers包括:
特征可视化¶
- Rank Features: 对单个或者两两对应的特征进行排序以检测其相关性
- Parallel Coordinates: 对实例进行水平视图
- Radial Visualization: 在一个圆形视图中将实例分隔开
- PCA Projection: 通过主成分将实例投射
- Feature Importances: 基于它们在模型中的表现对特征进行排序
- Scatter and Joint Plots: 用选择的特征对其进行可视化
分类可视化¶
- Class Balance: 看类的分布怎样影响模型
- Classification Report: 用视图的方式呈现精确率,召回率和F1值
- ROC/AUC Curves: 特征曲线和ROC曲线子下的面积
- Confusion Matrices: 对分类决定进行视图描述
回归可视化¶
- Prediction Error Plot: 沿着目标区域对模型进行细分
- Residuals Plot: 显示训练数据和测试数据中残差的差异
- Alpha Selection: 显示不同alpha值选择对正则化的影响
聚类可视化¶
- K-Elbow Plot: 用肘部法则或者其他指标选择k值
- Silhouette Plot: 通过对轮廓系数值进行视图来选择k值
文本可视化¶
- Term Frequency: 对词项在语料库中的分布频率进行可视化
- t-SNE Corpus Visualization: 用随机邻域嵌入来投射文档
... 以及更多!Visualizers随时在增加中,请务必查看示例(甚至是 develop branch 上的),并且随时欢迎你对Visualizers贡献自己的想法。
获取帮助¶
Yellowbrick是一个传承自Matplotlib和Scikit-Learn的热情包容的项目。和这些项目一样,我们遵守 Python Software Foundation Code of Conduct 。如果需要帮助、或者想要对项目进行贡献、或者发现有漏洞需要报告,请不要犹豫,随时和我们联系。
寻求帮助最主要的方法是在我们的 Google Groups Listserv 上发帖。这是社区会员可以加入以及互相回应的一个邮件列表/论坛;在这里你应该能得到最快的回应。希望你也能考虑加入这个组,这样你也可以回答问题!你也可以在 Stack Overflow and tag them with "yellowbrick". Or you can add issues on GitHub. You can also tweet or direct message us on Twitter @DistrictDataLab 上问问题。
开源¶
Yellowbrick license 使用开源 Apache 2.0 许可证。 Yellowbrickx拥有一个非常活跃的开发者社区;请考虑加入他们并且 贡献 !
Yellowbrick在 GitHub 上托管。issues 和 pull requests 都记录在上面。
目录¶
这个版本库的Yellowbrick文档的完整清单如下: