简介

Crop-GPA是一个作物基因-表型关联的集成育种平台,由安徽农业大学信息与人工智能学院开发。该平台旨在提供一个综合性和功能性的开源平台,以充分挖掘和利用数据进行现代分子育种。Crop-GPA通过直观的用户界面、动态的图形可视化和高效的在线工具,提供了关于作物基因和表型关联的详尽信息。

主要功能

数据收集与整理:平台收集并整理了大量的基因型和表型数据,包括1805个性状条目、80676个基因条目和374224个经过验证的基因-表型关联条目。

物种覆盖:这些数据覆盖了十种不同的作物物种,包括水稻、玉米、番茄、苜蓿、大豆、小麦、小米、油菜、棉花和高粱。

用户界面:提供了一个易于导航的用户界面,用户可以通过主页菜单轻松访问数据库,执行常见的任务,如浏览、搜索、使用GPA-BERT和GPA-GCN工具、下载数据和查看文档。

搜索与查询:用户可以通过物种、性状、基因或基因符号以及参考文献进行直接搜索和模糊查询。

结果展示:搜索结果页面提供了性状与其相关基因之间的全面关系列表,包括特定表型、涉及物种、基因符号、基因名称、父性状、性状组和参考ID。

数据下载:用户可以下载所有相关的基因和表型数据材料。

主要特点

开源平台:Crop-GPA是一个开源平台,允许用户自由访问和扩展数据集。

技术集成:建立在CentOS服务器上,使用HTML5、CSS3和Vue技术集成图形界面,使用Python Flask框架实现GPA-BERT和GPA-GCN工具。

自动化文本挖掘:GPA-BERT是一个基于BERT的文本挖掘工具,用于从科学文献中自动识别和提取基因-表型关联。

预测潜在关系:GPA-GCN是一个基于图卷积网络的计算工具,用于预测潜在的基因与表型之间的关系。

结论

Crop-GPA作为一个集成育种平台,为作物基因-表型关联研究提供了一个强大的工具。它不仅提供了大量的数据和直观的用户界面,还通过自动化文本挖掘和预测工具,增强了数据的挖掘和利用效率。这个平台对于农业科研人员和育种专家来说是一个宝贵的资源,有助于加速作物改良和新品种的开发。