L’intelligence artificielle de Google peut désormais évaluer des photos
Les systèmes d’intelligences artificielles sont depuis longtemps capables d’évaluer des détails techniques tels que le bruit, la netteté, la définition, etc., mais étaient jusqu’à présent incapables de juger l’aspect esthétique d’une image.
Google comble cette lacune en introduisant un nouveau système d’intelligence artificielle désormais capable d’évaluer les photos en fonction de leur qualité technique et esthétique. Ce nouveau système s’appelle NIMA ou Neural Image Assessment.
Pour ce faire, le système Nima s’appuie sur les puissants réseaux de reconnaissance d’objets profonds et sur leur capacité à comprendre les catégories générales d’objets malgré de nombreuses variations. Il est ainsi formé pour prédire quelles images un utilisateur typique qualifierait de belles (techniquement) ou attrayantes (esthétiquement).
Bien que cela puisse sembler très utopique, Google affirme que les scores Nima correspondent très étroitement aux scores donnés par un jury humain. En effet, les chercheurs ont demandé à 200 personnes d’évaluer les images, puis ont soumis les mêmes images au système NIMA. Les résultats obtenus sont quasiment identiques pour chaque photo.
Voici quelques exemples de photos avec des évaluations NIMA et des estimations humaines (entre parenthèses) :
Le score NIMA peut être utilisé non seulement pour évaluer des images, mais aussi pour diverses tâches chronophages, telles que la sélection des meilleures photos d’une longue série ou pour de la retouche photo. Pour ce faire, le système est capable de trouver les paramètres optimaux comme la luminosité, les hautes lumières, les ombres, etc., et ainsi permettre de minimiser l’implication de l’utilisateur et donc d’éliminer les erreurs visuelles que le photographe pourrait tolérer lors du traitement de la photo.
`
Bien que cette technologie soit déjà ultra performante, Google affirme qu’elle n’en est qu’à ses débuts et qu’elle pourrait dans un futur proche bouleverser le monde de la photo. Parmi les futures applications possibles, cela pourrait inclure la notation en temps réel dès la prise de vues et ainsi permettre au photographe débutant de trouver le meilleur cadrage, les meilleurs réglages, etc., avant même d’avoir déclenché.
Pour en savoir plus sur la technologie Nima, le blog de Google Research est disponible en cliquant ici.
Si vous avez aimé cet article, n’hésitez pas à vous abonner à la newsletter pour être informé lors de la publication des prochains sujets et pour recevoir gratuitement votre livre photo.
Pas tout à fait d’accord avec les scores. Je trouve la première photo, la mieux notée, assez banale. On en voit de partout des photos comme ça désormais. La photo 3 je la trouve pas terrible, cadrage bizarre. La 4 je comprends qu’elle intéresse plus les sondés que l’IA, car elle est originale. Chose que l’IA ne doit pas pouvoir ressentir. La 8, des montagnes, est vraiment médiocre. Les arbres bloquent la vue des montagnes, le cadrage est étrange, rien n’est mis en valeur réellement. En fait les scores vont dépendre de la période aussi. Les chutes d’eau en expo longue c’est devenu tellement à la mode que les notes vont s’en ressentir. Pareil avec l’effet de flou sur les vagues, ou la traînée d’un ciel étoilé. On s’en émerveillait il y a une dizaine d’années, c’est devenu commun de nos jours. De même, on fout la netteté à fond et on sursature les photos de nos jours, pourtant de jolis effets de flou ça a son intérêt aussi… La photo intemporelle c’est la photo bien composée, avec un beau sujet et une belle lumière tout simplement.
Je suis d’accord avec vous, certaines photos sont surévaluées. En revanche, la notation ici prend uniquement en compte l’aspect technique et esthétique. Pour le moment, l’originalité n’est pas prise en compte dans le classement. C’est pour cela que des photos banales comme la première ont des scores élevés.