
Journal of
Chemical Theory and Computation ( J. Chem. Theory Comput. 2023, 19, 15, 5242–5259)【1】。 SiteFerret算法的工作流程如图-1所示,首先运用NanoShaper软件为蛋白计算溶剂排斥表面(SES),过程中会生成不同半径的探针球体,通过对SES凹陷区域的探针球体进行特定的聚类就可以获得候选口袋。同时,SiteFerret为每个候选口袋计算几何、聚类与化学方面的特征,包括口袋体积、入口数、聚类打分、氨基酸组成、疏水性分数等。这些特征信息将输入一个Isolation Forest(IF)算法来为口袋进行打分与排序。IF是一种经典的无监督学习方法,与传统的二分类方法相比,IF可以输出更为准确的口袋评估结果。



Gagliardi,
L.; Rocchia, W. SiteFerret: Beyond Simple Pocket Identification in Proteins. Journal
of Chemical Theory and Computation 2023, 19 (15), 5242-5259.