Gboard de Google est facilement l’une des meilleures applications de clavier disponibles sur Android aujourd’hui, et ce pour toutes les bonnes raisons. Outre le clavier complet, l’application comprend des gestes pratiques pour déplacer le curseur ou sélectionner du texte et des modes d’expression adéquats grâce à une énorme bibliothèque d’emoji. Si les caractères standard approuvés par le Consortium Unicode ne suffisent pas, vous pouvez créer des combinaisons originales avec Emoji Kitchen. Nous apprenons maintenant que Google prévoit d’intégrer une IA photoréaliste appelée Imagen pour faciliter l’expression créative.
Si vous ne le savez pas, Imagen est l’un des projets de recherche de Google présenté en mai 2022. Il utilise l’IA pour convertir des invites textuelles en images photoréalistes, à l’instar des outils populaires DALL-E 2 et Midjourney. Le modèle d’IA comprend un encodeur de texte, un modèle de diffusion texte-image et un modèle de diffusion améliorant la résolution. En fouillant dans les chaînes de code de la dernière version bêta de Gboard (v12.7.05.507749191), 9to5Google rapporte avoir trouvé des références à un « Imagen Keyboard ». Cela pourrait être un signe de l’intégration prochaine d’Imagen à Gboard. Imagen pourrait probablement être ajouté dans la section des raccourcis de Gboard, avec des options comme les paramètres de thème, un sélecteur de GIF et l’intégration de Google Translate.
Les chances que cette nouvelle intégration de l’IA nous parvienne ne semblent pas exagérées. Depuis des mois maintenant, Google travaille sur les moyens d’intégrer l’IA dans ses services, comme cela a été clair lors de l’événement surprise où un chatbot conversationnel appelé Bard a été présenté. Cependant, Google Research a fait part de quelques inquiétudes quant à l’utilisation publique d’Imagen.

Le modèle d’IA n’est pas encore accessible au public, car Google craint que les gens ne l’utilisent à mauvais escient. En effet, l’IA d’Imagen a également été entraînée à l’aide d’ensembles de données contenant du matériel pornographique et des images extraites du Web, qui contiennent tous deux (au moins des sous-ensembles) des contenus inappropriés. Si Imagen utilise ces données, les résultats peuvent offenser certaines communautés ou apparaître comme racistes et stéréotypés.
Google promet de s’assurer que des garanties sont en place avant le déploiement d’Imagen auprès des masses, mais cela pourrait prendre un temps indéterminé. Le bon côté des choses, c’est qu’Imagen a aussi un énorme avantage : il repose sur des modèles de diffusion qui fonctionnent de manière optimale, même sur du matériel portable comme les smartphones, sans nuire de manière significative aux performances ou à l’autonomie de la batterie. Les résultats restent fidèles aux invites textuelles et s’en sortent admirablement bien dans les évaluations humaines. Nous ne sommes donc pas trop surpris que Gboard puisse bénéficier d’une plus grande intégration de l’intelligence artificielle à l’avenir. En attendant que Google règle les détails techniques, vous pouvez compter sur Emoji Kitchen pour obtenir des caractères hors du commun.