ByteDance tiene un 'bot' que extrae datos de Internet y lo hace 25 veces más rápido que el de OpenAI

ByteDance lleva meses extrayendo datos de Internet con un 'bot' llamado Bytespider, una actividad que hace a mayor velocidad que los 'bots' de otras empresas líderes en el mercado de los grandes modelos de lenguaje (LLM, por sus siglas en inglés).

Image description

   Los grandes modelos de lenguaje necesitan enormes cantidades de datos para su entrenamiento y estas solo se encuentran en internet, donde ya operan varios 'bots' para 'raspar' o extraer información de sitios web.

    Firmas como Google, Meta, Amazon, OpenAI y Anthropic utilizan sus propios 'bots', pero no son los únicos, ya que ByteDance también tiene el suyo, llamado Bytespider, que apareció en algún momento de abril, como han confirmado las firmas especializadas en este tipo de automatizaciones Kasada y Dark Visitors a Fortune.

   Bytespider tiene la particularidad de que en poco tiempo se ha vuelto muy agresivo en la recopilación de datos, como se desprenden de los informes de Kasada. Según el director ejecutivo de esta firma, Sam Crowther, extrae datos a una velocidad 25 superior a la de GPTbot (OpenAI) y 300 veces superior a la de ClaudeBot (Anthropic).

   El 'bot' de ByteDance, además, no respeta la línea de código robots.txt, que los editores de medios de comunicación pueden incorporar a su sitio web para indicar a los 'bots' que no extraigan datos. Tampoco lo respetan GPTbot y ClaudeBot.

   Detrás de esta extracción masiva de datos parece estar el desarrollo de un nuevo LLM por parte de ByteDance, según ha compartido una fuente familiarizada con el asunto con Fortune, que se usaría para la función de búsqueda de TikTok, según otra fuente.

Tu opinión enriquece este artículo:

Prosegur Security ha protegido la final de la Copa del Rey de Fútbol con un dispositivo formado por 1.000 profesionales de seguridad

Prosegur Security, líder en el sector de la seguridad privada, ha sido la compañía responsable, por cuarta vez, de proteger la final de la Copa del Rey, el campeonato nacional de fútbol más antiguo del país que se ha disputado entre el Real Madrid y el Barcelona en el Estadio de La Cartuja de Sevilla el sábado 26 de abril. En esta 121ª edición, el dispositivo de seguridad se ha reforzado y ampliado con 1=.000 profesionales de seguridad privada de la compañía localizados en distintos puntos del estadio y otros puntos de la ciudad, reflejando la creciente complejidad del evento que contará con más de 70.000 asistentes.

Barcelona (72%), Badalona (18%) y Sant Cugat del Vallés (2%), las ciudades con mayor porcentaje de reservas online para el Día de la Madre

El próximo domingo, con motivo del Día de la Madre, los restaurantes catalanes se preparan para esta celebración tan especial. Según las previsiones de TheFork, la plataforma líder de reservas en línea en Europa, las ciudades de la comunidad que acumulan un mayor porcentaje de reservas son Barcelona con un 72%, seguida de Badalona con un 18% y Sant Cugat del Vallés con un 2%. 

easyHotel amplía su presencia en España con un nuevo hotel en Barcelona, ya disponible para reservas desde 65 €

easyHotel continúa su rápida expansión por España con su segundo hotel en Barcelona: easyHotel Barcelona La Sagrera, el cual ya se encuentra disponible para reservas. Con apertura prevista el próximo, 7 de julio de 2025, esta nueva propiedad ofrece estancias asequibles y con bajas emisiones de carbono en uno de los barrios mejor conectados de la ciudad, y con precios desde 65 € por noche.

La era de la hipercocreación: Hyperice y Nike expanden las prestaciones de productos con Hyperboot

(Por Maurizio y Rodriguez Otero) En un mundo donde la tecnología redefine los límites del rendimiento deportivo, la colaboración entre Hyperice y Nike presenta las Hyperboot, una innovación que transforma la manera en que los atletas abordan el calentamiento y la recuperación. Estas botas, equipadas con tecnología de vanguardia, no solo prometen mejorar el rendimiento físico, sino también revolucionar el bienestar integral de los deportistas. En la era de la hipercocreación, donde la innovación se encuentra con la necesidad, las Hyperboot emergen como un símbolo de progreso y eficiencia en el ámbito deportivo.

(Lectura de alto valor estratégico: 5 minutos)

El Cero KM, la startup que revoluciona la compra de autos en Argentina: sin concesionarias, ni burocracia, y 100% online

Comprar un auto 0km en Argentina siempre fue sinónimo de mala atención, trámites engorrosos, falta de información y precios poco claros. En este contexto, llega El Cero KM, el primer marketplace de autos nuevos que permite comprar un 0km en Argentina de forma 100% online, sin necesidad de pisar una concesionaria ni hablar con un vendedor. Y lo que hasta ahora parecía imposible, ya es una realidad: en marzo se concretó la primera venta, completamente digital, de un auto en el país.

Éste sitio web usa cookies, si permanece aquí acepta su uso. Puede leer más sobre el uso de cookies en nuestra política de cookies.