Actualités & Nouveautés

infocepo.com – Cloud, AI & Labs | Mise à jour régulière

🤖 IA & Modèles

  • Qwen Ajout de Qwen3.6 : améliorations majeures en agentic coding et préservation de la pensée.
  • STT Gemma4 STT : qualité très bonne, compatible OpenAI, mais gourmand en mémoire.
  • STT Qwen3 STT : compatible OpenAI, bonne charge théorique via vLLM.
  • STT Cohere STT : tests non convaincants en multilingue, pertinent en monolangue.
  • Hermes Agent : l'agent qui s'améliore et grandit avec toi.

☁️ Infrastructure & RAG

  • Agentic RAG : compatibilité Open WebUI activée.
  • LightRAG : framework léger combinant graphes de connaissances et recherche vectorielle.
  • APIs : Ajout des endpoints reranker et embedding.
  • Optimisation : Mise à jour des paramètres RAG et ajout de experimental brains.
  • Privacy : Filtrage des données personnelles (PII) intégré.

🎙️ Audio & Temps Réel

  • Omnivoice TTS : qualité augmentée, support de 600 langues.
  • Realtime Translation : réduction des hallucinations sur silences, latence diminuée.
  • Sam-audio : séparation audio sémantique.
  • API Realtime : WebRTC / WebSocket bidirectionnel basse latence.

🛠️ Outils & Développement

  • CLAUDE.md : Fichier unique inspiré d'Andrej Karpathy pour transformer Claude en ingénieur logiciel.
  • OpenCode : CLI coder à comparer avec Aider / OpenHands.
  • api-convert2md : Extraction de tableaux pour RAG compatible Open WebUI.
  • Langextract : Démo d'extraction d'entités.

🚀 Projets & Sécurité

  • Legal-Agent : Nouvel agent dédié au juridique.
  • AI-Security : Focus sécurité IA.
  • DGX Spark : Architecture CPU ARM découverte/testée.