Google habla sobre la importancia del código abierto y los datos abiertos en una publicación de blog reciente

Tecnología / Google habla sobre la importancia del código abierto y los datos abiertos en una publicación de blog reciente 3 minutos de lectura

Google



Google, como empresa, siempre ha apoyado el software y los datos de código abierto, al menos en su stand. Es casi una tendencia en las grandes empresas ahora, ya que tanto Google como Microsoft han hecho contribuciones destacadas al panorama del código abierto. ' Google también es un importante contribuyente al software de código abierto. Ejemplos clave de esto incluyen Android , nuestro sistema operativo para teléfonos inteligentes, Cromo , el código base para nuestro navegador Chrome (ahora también impulsando a muchos competidores ), y TensorFlow , nuestro sistema de aprendizaje automático. Lanzamiento de Google de Gobernadores cambió el alojamiento en la nube para siempre y ha permitido la innovación y la competencia en la industria de la nube. Google también es el mayor contribuyente de código fuente abierto a GitHub , un repositorio compartido para el desarrollo de software. En 2017, los empleados de Google realizaron más de 250.000 cambios en decenas de miles de proyectos solo en GitHub.

En la mayoría de los casos, no es realmente por generosidad, sino más bien por beneficiarse del desarrollo gratuito y luego beneficiarse de la adopción generalizada. Independientemente, estas contribuciones han ayudado a miles de investigadores y han encabezado el desarrollo de software de manera uniforme, lo que debe celebrarse. Google en una publicación de blog reciente destacó su contribución a los datos abiertos y el software de código abierto.



Con la llegada del seguimiento en tiempo real y el desarrollo de automóviles sin conductor, se están realizando muchas investigaciones en visión por computadora y Google es una de las empresas a la vanguardia de la tecnología visual.



Nuestro compromiso con el código abierto y los datos abiertos nos ha llevado a compartir conjuntos de datos, servicios y software con todos. Por ejemplo, Google lanzó el Conjunto de datos de imágenes abiertas de 36,5 millones de imágenes que contienen casi 20.000 categorías de objetos etiquetados por humanos. Con estos datos, los investigadores de visión por computadora pueden entrenar sistemas de reconocimiento de imágenes. Del mismo modo, los millones de videos anotados en el YouTube-8M La colección se puede utilizar para entrenar el reconocimiento de video.



- Cosa variante

Economista jefe de Google

Google también cuenta con una gran cantidad de datos que pueden ayudar a la investigación de la PNL y ayudar a las computadoras a comprender mejor el habla humana. En la publicación del blog, Google destacó el intercambio de una base de datos clave que dice ' Con respecto al procesamiento del idioma, compartimos el Preguntas naturales base de datos, que contiene 307,373 preguntas y respuestas generadas por humanos. También hemos puesto a disposición Trillón de Word Corpus , que se basa en palabras utilizadas en páginas web públicas, y el Visor de Ngram , que se puede utilizar para explorar los más de 25 millones de libros en libros de Google . Estas colecciones se pueden utilizar para traducción automática estadística , reconocimiento de voz, corrección ortográfica , detección de entidades, extracción de información y otras investigaciones lingüísticas '.



El motor de búsqueda es uno de los negocios principales de Google y recibe más de 63.000 consultas por segundo. Estos datos son muy importantes para la empresa y Google analiza estos datos para publicidad dirigida. Aún así, algunas estadísticas sobre los datos generales se hacen públicas en el portal de tendencias de Google.

Google también ofrece Tendencias de Google , un servicio gratuito que permite a cualquier persona ver y descargar la actividad de búsqueda agregada desde 2004 para Búsqueda de Google, Búsqueda de imágenes, Búsqueda de noticias, Compras y YouTube. Puede obtener información de búsqueda por países, regiones, áreas metropolitanas y ciudades de forma mensual, semanal, diaria e incluso por horas. Los datos de Tendencias son ampliamente utilizados por investigadores en campos tan variados como la medicina y la economía. Según Google Scholar, hay más de 21.000 trabajos de investigación que citan Tendencias como fuente de datos '.

¿Por qué trabajar en proyectos de código abierto?

Hablé de esto brevemente al principio del artículo. Una nueva pieza de software puede implementar una gran idea e innovar el espacio, pero eso no impide que otros implementen ideas similares y luego trabajen para mejorarlas. Muchas empresas lo han aprendido por las malas, por ejemplo, Windows Phone. Como sabemos, fue un fracaso rotundo y por muchas razones, pero tener un entorno cerrado y controlar las licencias fue una gran parte. Hardoop y HDFS eran versiones de código abierto de MapReduce creadas por Google y la empresa aprendió la importancia del código abierto desde el principio. Resumiendo, la decisión de hacer una IP de código abierto es estratégica.

Google en su publicación de blog profundiza en algunas otras razones, afirmando ' En primer lugar, nuestra misión principal es 'organizar la información del mundo y hacerla universalmente accesible y útil'. Ciertamente, una forma obvia de hacer que la información sea universalmente accesible y útil es regalarla. !”

También hablan sobre por qué no pueden publicar algunas cosas diciendo ' Por supuesto, no podemos divulgar todos los datos que usamos en nuestro negocio. Necesitamos proteger la privacidad del usuario, mantener la confidencialidad para los clientes comerciales y proteger la propiedad intelectual de Google. Pero, sujeto a tales consideraciones, generalmente tratamos de hacer que nuestros datos sean lo más 'universalmente accesibles y útiles' como sea posible.

Etiquetas google