vLLM es un motor de inferencia open source que sirve modelos de lenguaje a gran escala.
La arquitectura V1 incluye servidor API, AsyncLLM, EngineCore, Scheduler, ModelExecutor, ModelRunner y KVCacheManager.
El servidor API recibe solicitudes HTTP, AsyncLLM tokeniza y envía peticiones al EngineCore vía IPC para evitar el GIL.
+4 more insights
El Departamento de Defensa de EE. UU. dejará de compartir datos satelitales meteorológicos con científicos y pronosticadores.
Estos datos, recogidos por satélites del DoD y procesados por el Centro de Meteorología y Oceanografía Numérica de la Flota, han sido esenciales para el seguimiento en tiempo real de huracanes y el monitoreo del hielo marino.
La medida generará brechas en la información que podrían impedir detectar a tiempo la formación o intensificación rápida de huracanes.
+2 more insights
Existen dos tipos de correo electrónico: texto plano y HTML.
Muchos usuarios técnicos prefieren el correo en texto plano.
Se ofrece una lista de clientes recomendados que usan texto plano por defecto.
+4 more insights
La Oficina de Derechos de Autor de EE. UU. está sin líder tras el despido por correo de la registradora Shira Perlmutter y de la bibliotecaria Carla Hayden.
Perlmutter demandó al gobierno alegando despido inválido y sostiene que sigue siendo la registradora, mientras el Ejecutivo designa a Paul Perkins como sustituto.
Existe un conflicto interno sobre quién es el líder legítimo: Todd Blanche nombra a Perkins, pero Robert Newlen afirma ser el bibliotecario interino.
+3 more insights
Facebook solicita permiso para acceder al carrete de fotos no compartidas y ofrecer sugerencias de edición con IA.
La función aparece al crear una nueva Story y requiere optar por “procesamiento en la nube” aceptando subir continuamente fotos a los servidores de Meta.
Meta usa datos como fecha, ubicación, presencia de personas u objetos para generar collages, recapitulaciones y restilizaciones con IA.
+5 more insights
El TTAB desestimó la demanda de fraude de Deno contra Oracle por usar una captura de Node.js para renovar la marca JavaScript.
Deno centrará el caso en demostrar que “JavaScript” es un término genérico y ha sido abandonado como marca.
Oracle debe responder a la petición de cancelación admitiendo o negando cada punto antes del 7 de agosto.
+2 more insights
Se ha aumentado progresivamente el límite inferior de BB(6): primero a 10 tetrado de 10 repetido 15 veces, luego a 10 tetrado de 10 repetido 10 000 000 de veces y finalmente a 2 pentado a 5.
BB(n) es la función Busy Beaver que mide el máximo número de pasos de una máquina de Turing de n estados antes de detenerse.
Para dar una idea de la magnitud, 10 tetrado a 10 repetido 10 000 000 de veces es suficiente para llenar esa cantidad de universos observables con granos de arena.
+4 more insights
Las nuevas redes sociales con buenas intenciones acaban sometidas a presiones de crecimiento que corrompen su misión original.
La financiación de capital de riesgo impulsa un ciclo de crecimiento exponencial que prioriza métricas de usuarios activos diarios sobre la conexión genuina.
Los algoritmos manipulan emociones para maximizar el tiempo en la plataforma, generando adicción a través de recompensas variables y contenidos polarizantes.
+4 more insights
Un grupo de estudiantes diseñó e implementó una CPU RISC personalizada en FPGA.
Desarrollaron desde cero un compilador C89 llamado Ucc para compilar Xv6.
Portaron el sistema operativo educativo Xv6 a su CPU casera usando un simulador y hardware real.
+5 more insights
Se han descubierto 27 obras inéditas de Erik Satie un siglo después de su muerte.
Estas piezas se hallaron en libretas que Satie utilizó en los bistrós de Montmartre.
James Nye y Sato Matsui descifraron y recopilaron los fragmentos para su interpretación.
+2 more insights