Je bosse au 4/5 sur les modèles de langage (LLM, parfois appelées IAs) et à 2/5 sur la robotique open hardware AMA

@[email protected] · 7 months ago

Je bosse au 4/5 sur les modèles de langage (LLM, parfois appelées IAs) et à 2/5 sur la robotique open hardware AMA

@[email protected] · 7 months ago

Oh oui, les réseaux de neurone ça date au moins des années 50 et certains outils mathématiques sont encore plus anciens! Dans les années 90-2000 on traversait le deuxième hiver de l’IA (tiens donc encore une page qui n’a pas été traduite en français!) et seuls quelques fervents zélotes tels que Hinton ou Le Cun prêchaient encore le perceptron multi-couches qui est un vieil algo! C’est plus leur “foi” que leurs innovations qui ont amené la vague actuelle.

Il y a un point de bascule très net en 2012 quand AlexNet emporte la compétition ImageNet, une compétition de classification d’images (“Identifie l’objet dans l’image parmi 1000 catégories: banane, chien, humain, voiture, etc…”). L’architecture n’était pas nouvelle, mais de petites améliorations ont été amenées et surtout, elle a été porté en CUDA et peut donc tourner très vite sur des GPUs récents.

D’un coté les algos sont devenus un peu plus efficaces, de l’autre le hardware est devenu plus performant. En 2012 ça s’est croisé et il est devenu plus efficace d’entraîner des réseaux “boite noire” que des algos spécialisés.

Alors c’est peut être plus tôt que tu ne le penses, mais c’est la bascule du point de vue des devs, et à partir de ce moment là on a commencé à mettre du réseau de neurones partout.

Pour le grand public, la découverte a été via la génération de texte. Il y a 2 points je pense: d’abord GPT-2, premier à sortir des textes étonnamment cohérents. Puis ChatGPT, qui a permis à tout le monde de réaliser que c’était réel, utile, et que certaines composantes de l’intelligence étaient là.

Puis, google deep dream avec déjà fait pas mal le buzz avec de la génération d’image il y a genre 10 ans, et pourtant, ça avait pas pris.

Deep dream a été une étape vers les générateurs d’image qu’on a aujourd’hui. Deep dream aujourd’hui ressemble presque à un hack d’un classifieur d’images, mais ça n’a pas pris parce que la qualité était très mauvaise. Elle a doucement augmenté petit à petit. Il y a eu deux sauts:

Les premiers GANs qui ont tout d’un coup produit des images d’un réalisme bluffant (qui aujourd’hui nous blase…)
Les modèles de diffusion, qui sont ce que tout le monde utilise aujourd’hui. Je crois, mais c’est moins mon domaine, que leur intérêt est de pouvoir se connecter à des modèles de langage et de pouvoir exprimer/comprendre un panel beaucoup plus large d’objets.

@[email protected] · 7 months ago

Intéressant le point historique sur la période 2000-2012. Et ca explique même pourquoi c’était un quasi sexagénaire qui posait la question des Réseau de neurones