Blue Planet Studio - stock.adobe
Google dope VirusTotal à l’IA générative
Google vient de lever le voile sur la fonctionnalité Code Insight de VirusTotal. Cette fonctionnalité produit des résumés de fragments de code en langage naturel. De quoi accélérer le travail des analystes.
Google vient de présenter VirusTotal Code Insight, une fonctionnalité basée sur l’application de l’intelligence artificielle à l’analyse de code. Mettant à profit Google Cloud Security AI Workbench, Code Insight produit des résumés en langage naturel de fragments de code. Cette fonctionnalité vise à permettre aux experts en sécurité et aux analystes d’obtenir des informations plus approfondies sur le but et le fonctionnement du code analysé, améliorant considérablement leur capacité à détecter et contrer les éventuelles menaces.
Ici, on ne parle plus de simple application de modèles établis à partir d’apprentissage automatique (ML), comme il y a bientôt dix ans, pour la détection d’exécutables malveillants sur les postes de travail et les serveurs : il s’agit de mettre à profit les récents progrès dans les grands modèles de langage (LLM).
Dans un billet de blog, Google relève que « lorsque ces modèles sont entraînés sur des langages de programmation, ils peuvent transformer habilement le code dans des explications en langage naturel. Cette innovation accélère non seulement l’analyse des logiciels malveillants, mais renforce également une variété d’applications de cybersécurité ».
Pour Code Insight, Google indique s’être appuyé sur Sec-PaLM, « l’un des modèles d’IA génératifs hébergés sur Google Cloud AI ». L’intérêt ? Disposer de fonctionnalités de génération « de résumés en langage naturel du point de vue d’un collaborateur d’IA spécialisé en cybersécurité et en logiciels malveillants. Cela fournit aux professionnels de la sécurité et aux analystes un outil puissant pour comprendre ce que fait le code ».
En l’état, Code Insight n’est pas appliqué à tout ce que peut recéler VirusTotal : « cette nouvelle fonctionnalité est déployée pour analyser un sous-ensemble de fichiers PowerShell ». Les scripts trop similaires à ceux déjà examinés, ou excessivement volumineux, sont ignorés de telle manière que « seuls les fichiers les plus pertinents (tels que les fichiers .PS1) sont soumis à un examen minutieux ». Mais Google prévoit déjà d’élargir, très vite, l’éventail des types de fichiers concernés.
La fonctionnalité Code Insight fonctionne seule, sans tenir compte des détections des moteurs tiers embarqués dans VirusTotal, ou de métadonnées associées à un échantillon. Selon Google, cela doit aider à débusquer des faux négatifs ainsi que des faux positifs.