结构式检索解决方案
2025-06-17
2025 Rawls 原创

结构式检索(Structure Search)是化学信息学领域中的一种重要技术,它通过化学结构来搜索相同或相似结构的化合物。相比用Cas No.、中英文名称、分子式等检索,结构式检索更精确、直观、专业,在科研和工业中用途广泛。


对于医药化学类企业,支持结构式检索可以获得以下优势:

1、网站更加专业:结构式检索采用图形算法,可以让访问者认可网站的专业性。

2、吸引科研人员:很多科研人员其实根本不记忆Cas、英文名之类的。他们更多是记忆结构,更想要直接查找某个结构对应的产品是否存在。对于数据量较大的化学网站,此功能是必须要具备的。

3、促进销售:化合物结构往往决定性质,构效关系 (SAR)是药学的重要基础。也许目标产物没有库存,但用户可通过结构式检索寻找相似结构,从而下单促进销售。


朝晤科技全线产品产品均支持结构式检索,并支持全结构、子结构、相似性(可自定义相似度)检索化合物。

结构式检索功能包含三大模块:

1、结构式编辑器

2、结构式检索算法(全结构、子结构、相似性)

3、化合物结构如何保存至数据,以支持图片检索算法


Part 1: 结构式编辑器


朝晤结构式编辑器优势:

1、支持手绘结构、支持复制Smiles,mol 快速生成结构。

2、支持复制图片,快速生成结构图片。

3、纯JS插件,需要任何支持与二次开发,即可集成至网页。

4、界面美观,风格简洁。

5、朝晤全线产品免费支持。


Part 2: 结构式检索算法



结构式检索一般采用子图同构算法,同时在化合物数量庞大时,还需要建立结构的指纹特征。生成结构式频繁子图索引,以加快检索速度。

1、全结构检索:只检索结构完全相同的化合物

2、子结构检索:目前化合物的结构包含需要搜索的结构

3、相似性检索:用户可指定相似度,比如90%相似,80%相似,从而检索出结构相近的化合物。

摩尔建站的结构式检索,能够支持千万级化合物数据库的数据检索,并且确保能够在1秒出检索结果。


Part 3: 化合物结构如何保存

化合物结构描述最常用的为mol文件。但此文件长度较大,对于大量化合物数据的维护不利。因此一般我们推荐使用smiles作为化合物结构的保存方式。Smiles代码是一段简单文本,可以直接在Excel中做为数据列维护。如果您使用朝晤产品,可以通过表格导入这些数据,则结构式图片将自动生成,无需人工维护。大幅提高企业效率。



虽然Smiles能够应对绝大部分化合物结构生成,但对于一些特殊结构(比如手性化合物)可能会存在结构显示不准确的情况。此时,需要软件能够支持上传mol文件或图片,以取代Smiles自动生成的结构,提高信息准确性。