Imputation Versus Prediction: Applications in Machine Learning for Drug Discovery

Irwin, Benedict WJ; Mahmoud, Samar; Whitehead, Thomas M; Conduit, Gareth J; Segall, Matthew D

doi:10.4155/fdd-2020-0008

Imputation Versus Prediction: Applications in Machine Learning for Drug Discovery

Published version

Peer-reviewed

Repository URI

https://www.repository.cam.ac.uk/handle/1810/304306

Repository DOI

https://doi.org/10.17863/CAM.51387

Files

Published version (2.42 MB)

Bibliographic metadata (41.07 KB)

Supporting information (6.52 MB)

Type

Article

Authors

Irwin, Benedict WJ

Mahmoud, Samar

Whitehead, Thomas M

Conduit, Gareth J

Segall, Matthew D

Abstract

jats:p Imputation is a powerful statistical method that is distinct from the predictive modelling techniques more commonly used in drug discovery. Imputation uses sparse experimental data in an incomplete dataset to predict missing values by leveraging correlations between experimental assays. This contrasts with quantitative structure–activity relationship methods that use only descriptor – assay correlations. We summarize three recent imputation strategies – heterogeneous deep imputation, assay profile methods and matrix factorization – and compare these with quantitative structure–activity relationship methods, including deep learning, in drug discovery settings. We comment on the value added by imputation methods when used in an ongoing project and find that imputation produces stronger models, earlier in the project, over activity and absorption, distribution, metabolism and elimination end points. </jats:p>

Keywords

33 Built Environment and Design, 3404 Medicinal and Biomolecular Chemistry, 34 Chemical Sciences, Machine Learning and Artificial Intelligence, Bioengineering, Networking and Information Technology R&D (NITRD)

Journal Title

Future Drug Discovery

Journal ISSN

2631-3316
2631-3316

Volume Title

2

Publisher

Informa UK Limited

Publisher DOI

https://doi.org/10.4155/fdd-2020-0008

Rights

Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0)

Collections

Jisc Publications Router

Imputation Versus Prediction: Applications in Machine Learning for Drug Discovery

Published version

Peer-reviewed

Repository URI

Repository DOI

Files

Type

Change log

Authors

Abstract

Description

Keywords

Journal Title

Conference Name

Journal ISSN

Volume Title

Publisher

Publisher DOI

Rights

Collections