January 26, 2016 12:04 pm

CNTK, el nuevo paquete de herramientas de aprendizaje profundo de código abierto de Microsoft en GitHub

CNTK_1

Microsoft ha comenzado a fabricar las herramientas que sus propios investigadores usan para acelerar los avances en inteligencia artificial que estén disponibles para un amplio grupo de desarrolladores, al lanzar su Paquete de Herramientas de Red Computacional en GitHub.

Los investigadores desarrollaron este paquete de herramienta de código abierto, apodado CNTK, por necesidad. Xuedong Huang, jefe científico de habla en Microsoft, dijo que él y su equipo estaban ansiosos por realizar mejoras más rápidas en las formas en las que las computadoras entienden el habla, y cómo las herramientas con las que tenían que trabajar los retrasaban.

Así que un grupo de voluntarios se prepararon para resolver este problema por sí solos, con ayuda de una solución casera que resaltó el rendimiento sobre todo lo demás.

El esfuerzo rindió frutos.

Huang dice que en las pruebas internas, CNTK ha probado ser más eficiente que otros cuatro paquetes de herramientas computacionales populares, los cuales los desarrolladores utilizan para crear modelos de aprendizaje profundo para cosas como habla y reconocimiento de imágenes, ya que tienen mejores capacidades de comunicación.

“El paquete de herramientas CNTK es mucho más eficiente que cualquier otra que hemos visto”, Huang dijo.

Ese tipo de ganancias en desempeño son muy importantes en el cambiante campo del aprendizaje profundo, porque algunas de las tareas más grandes del aprendizaje profundo pueden tomar hasta semanas para terminarlas.

CNTK_2Comparación de velocidad (cuadros sobre segundo, entre más alto, mejor)

En los últimos años, el campo del aprendizaje profundo ha explotado conforme más investigadores han empezado a hacer funcionar los algoritmos del aprendizaje de máquina, a través de las redes neuronales profundas, las cuales son sistemas que están inspirados por el proceso biológico del cerebro humano. Muchos investigadores ven el aprendizaje profundo como un acercamiento muy prometedor para poder mejorar la inteligencia artificial.

Esas ganancias han permitido a los investigadores crear sistemas que puedan reconocer con precisión e incluso traducir conversaciones, así como sistemas que puedan reconocer imágenes y responder preguntas acerca de ellas.

De manera interna, Microsoft utiliza CNTK en un poderoso set de computadoras, que utilizan unidades de procesamiento gráfico, o GPU.

A pesar de que los GPU fueron diseñados para computadoras gráficas, los investigadores han encontrado que también son ideales para procesar el tipo de algoritmos que se dirigen a estos mejores avances tecnológicos, que dan como resultado, el que puedan hablar, entender discursos, y reconocer imágenes y movimientos.

Chris Basoglu, director de desarrollo en Microsoft, quien también trabajó en el paquete de herramientas, dijo que una de las ventajas de CNTK, es que puede usarse por cualquier investigador que tenga un presupuesto limitado, con una sola computadora, hasta alguien que tenga la habilidad de crear su propio grupo de GPU basados en computadoras. Los investigadores dicen que se puede escalar a través de más GPU basados en máquinas que en otros paquetes de herramientas disponibles para el público, lo cual provee una ventaja clave para los usuarios que quieren realizar experimentos a gran escala, o cálculos.

CNTK_3 Xuedong Huang (fotografía por Scott Eklund/Red Box Pictures

Huang dice que fue importante para su equipo poder dirigir las necesidades internas con una herramienta como CNTK, pero ellos también quieren proveer los mismos recursos para otros investigadores que realizan avances similares dentro del aprendizaje profundo.

Es por eso que decidieron poner a disposición de investigadores y desarrolladores las herramientas a través de licencias de código abierto

El pasado abril, los investigadores volvieron disponible la herramienta para los investigadores académicos, a través de Codeplex, y bajo una licencia de código abierto con más restricciones.

Pero ya también está disponible, a través de una licencia de código abierto, para cualquiera que quiera usarla. Los investigadores dicen que podría ser útil a cualquiera, desde nuevas empresas de aprendizaje profundo, hasta compañías más establecidas que procesan toneladas de datos en tiempo real.

“Con CNTK, ellos pueden unirse a nosotros para impulsar los avances en inteligencia artificial”, Huang dice.