SAS, ha anunciado la compra de la empresa privada Teragram, líder en procesamiento lingüístico natural (NLP) y tecnología lingüística avanzada. La adquisición fortalecerá la oferta propia de SAS en BI analítico y text mining y la ampliará a toda empresa y a la búsqueda móvil.
Hace más de una década, SAS fue una de las primeras empresas en reconocer la importancia del text mining, del análisis de textos y de otros datos desestructurados tales como páginas web, documentos, email, imágenes y otra información no almacenada en una base de datos estructurada. Hoy, SAS lidera este importante y creciente segmento.
La suma de la experiencia de Teragram y de la tecnología NLP cambiará el entorno del BI y de los mercados de analítica, dijo Jim Goodnigth, CEO de SAS. Las tecnologías de Teragram aumentan, consolidan y amplían la capacidad de SAS de combinar datos estructurados y no estructurados no solamente en nuestra solución text mining sino en toda la Plataforma de Inteligencia de Negocio de SAS para proporcionar mejores respuestas más rápidamente.
Teragram, una firma de 40 personas con base en Cambridge, Massachussets, será gestionada como una compañía de SAS. Los términos del acuerdo de adquisición no han sido revelados. La consolidada tecnología NLP de Teragram cuenta con una base de clientes que incluye CNN, Forbes.com, NYTimes Digital, Sony, WashingtonPost.com, Wolters Kluwer, el Banco Mundial y Yahoo!.
Mientras la explosión de datos continúe, las compañías necesitan un modo inteligente de hacer que todo ello tenga sentido, ya estén los datos estructurados en bases de datos o en una gran variedad de fuentes desestructuradas, dijo Yves Schabes, Presidente de Teragram. Teragram y su tecnología encajan perfectamente con la oferta de análisis y text mining de SAS, ya que SAS continúa innovando en este mercado en continuo y rápido crecimiento. Estamos encantados de unirnos a una compañía que proporciona el software que las empresas necesitan para combinar datos estructurados y no estructurados y tomar decisiones mejores y más precisas en menos tiempo.
La tecnología de procesamiento lingüístico natural (NLP) de Teragram ayuda a convertir el texto- en muchos idiomas y procedente de diferentes fuentes- en información utilizable. NLP permite el procesamiento de datos más ricos a nivel de palabras, relaciones lingüísticas y significado de palabras. Teragram ha desarrollado y mantiene extensos diccionarios comentados que contienen varios cientos de millones de palabras en más de 30 idiomas.
Las tecnologías de categorización avanzada de Teragram permiten la clasificación avanzada e inmediata de los documentos de acuerdo a criterios personalizados, aplicados en toda la organización. Esto permite un acceso más rápido y preciso a los documentos, organizados por temas específicos que encajan con los intereses de un usuario en particular, sin importar la localización original de un documento.
En la búsqueda empresarial, las tecnologías NLP de Teragram exploran bases de datos corporativas estructuradas y fuentes no estructuradas incluyendo informes basados en texto y páginas web para proporcionar respuestas exhaustivas basadas en estas múltiples fuentes de información.
Con las compañías multinacionales de hoy en día y con la mano de obra distribuida, y con los enormes volúmenes de datos en diferentes sistemas y formatos, es más importante que nunca conseguir respuestas rápidas y precisas a las preguntas de negocio clave, dijo Schabes. La búsqueda empresarial es un arma competitiva para la explotación de los recursos de datos existentes dentro de la organización. La combinación de la Inteligencia de Negocio, la integración de los datos y el análisis avanzado de SAS con las tecnologías NLP de Teragram resolverá las búsquedas en segundos.
Las sofisticadas aplicaciones de búsqueda de Teragram proporcionan un entorno fácil de usar para el BI, ampliando la disponibilidad y uso del BI por parte de las organizaciones. La combinación de las tecnologías de SAS y Teragram facilita la indexación no sólo por el encabezado de un informe, sino por su contenido total y los metadatos asociados a él.
Teragram también proporciona a SAS la siguiente generación de búsqueda móvil, ayudando a los individuos a explorar la información de forma remota y obtener respuestas más rápidamente. Usando la tecnología de búsqueda móvil de Teragram, los individuos pueden almacenar y recuperar información, conectarse a aplicaciones externas tales como sistemas BI, y buscar en bases de datos desde su blackberry, smarthphone u otro dispositivo móvil.
El experto en gestión empresarial, Bill Jensen despreció en el año 2001, en su libro Simplicity los inconvenientes de la explosión de información de hoy en día. Según su investigación, repetida por otros, las estimaciones más conservadoras demuestran que actualmente la información de negocio está duplicándose cada 18 meses. Este flujo de datos solo ha crecido de un modo más pronunciado en los últimos años, y muchos de estos datos suelen encontrarse fuera de las bases de datos tradicionales y estructuradas. Según las estimaciones, los datos no estructurados comprenden hasta un 70% de todos los datos de negocio.
Estos datos no estructurados residen en los comentarios de los clientes en, e.mails y chat, documentos e investigaciones, blogs, reclamaciones de garantías, curriculums vitae, mensajes de voz y registros de teléfono, entre otras fuentes.
Si las compañías no pueden incluir estos datos no estructurados en sus análisis de datos de clientes, oportunidades de mercado, operaciones internas, suministro en cadena, etc. sólo están viendo una parte del cuadro entero, y como resultado pueden tomar malas decisiones. Análisis potentes como los de SAS ayudan a las organizaciones a combinar datos estructurados y no estructurados para describir modelos y tendencias ocultas, y después usar estos conocimientos para tomar mejores decisiones, solucionar problemas y aprovechar las oportunidades.
SAS ha ofrecido capacidades de data mining dentro de su software desde hace más de 10 años, y ya en 2002 lanzó un producto específico, SAS Text Miner.
Actualmente, SAS Text Miner se incluye en numerosas soluciones para industrias específicas, incluyendo SAS Warranty Analysis. Fabricantes como General Motors utilizan esta solución para reunificar y analizar de conjuntamente reclamaciones de garantía y datos de servicio, en su mayoría no estructurados. Estos datos permiten descubrir posibles problemas con la suficiente antelación para poder reaccionar con rapidez, y conseguir una mejora de la calidad del producto y un aumento de la satisfacción del cliente, así como su fidelización.
Los bancos utilizan la tecnología de análisis de textos en las transcripciones de las llamadas de sus clientes y en los metadatos relativos (como la duración de la llamada, el tiempo de espera, el número de transferencias) para determinar el grado de satisfacción del cliente y predecir resultados (si el cliente tiene un buen riesgo de crédito o si su intención es cerrar una cuenta, por ejemplo). Las compañías de seguros utilizan la tecnología de análisis de textos en sus reclamaciones de liquidaciones y en la información demográfica, para detectar posibles reclamaciones fraudulentas.