L'auteur retrace les développements significatifs des six derniers mois dans le domaine des modèles de langage (LLM), avec une forte accélération des innovations dans cette période.
Plus de trente modèles notables ont été lancés récemment, rendant leur évaluation complexe pour les utilisateurs.
L'entrée dans le domaine des modèles puissants qui peuvent être exécutés localement, comme le Llama 3.3 et le Mistral Small 3, a permis des performances élevées sur du matériel standard.
OpenAI, avec ses modèles GPT 4.1, offre des performances impressionnantes à des coûts moindres, alors que GPT 4.5 est considéré comme un échec coûteux.
Un focus est mis sur l'intégration des outils et du raisonnement dans les LLM, améliorant leur efficacité, notamment pour les recherches basées sur internet.
Les défis éthiques et sécuritaires liés aux LLM incluent des questions de confidentialité des données et de manipulation des modèles par des tiers.
Une méthode originale pour évaluer les capacités des LLM à travers un test consistant à générer le dessin d'un pélican sur un vélo a été employée par l'auteur.
Get notified when new stories are published for "🇫🇷 Hacker News Français"