Софтуер

Informatica пусна парсер за Hadoop

Computer World

HParser включва набор от библиотеки за различни типове данни – от стандарти като XML до индустриално специфични формати като HIPAA в здравеопазването или ASN.1 в телекомуникациитеInformatica пусна на 2 ноември парсерът за данни HParser за Hadoop, програмната рамка с отворен код за обработка на големи количества информация. Синтактичният анализатор може да трансформира неструктурирани данни в по-структурирана форма, за да бъдат използвани в Hadoop.

HParser включва набор от библиотеки за различни типове данни – от стандарти като XML до индустриално специфични формати като HIPAA в здравеопазването или ASN.1 в телекомуникациите.

Продуктът идва в три издания, две от които са комерсиални – HParser Industry Standards и HParser for Documents, а другото в community версия, която е безплатна, но за премиум услуги и адони се заплаща. Също така Informatica обяви, че community версията на HParser ще бъде налична за употреба и ще може да се сваля от сайта на Hortonworks, която е част от Yahoo.

Според Дейвид Менингър, вицепрезидент и директор за проучванията във Ventana Research, една от големите пречки пред Hadoop е, че много ИТ компании нямат уменията да започнат да работят с рамката, но HParser може да помогне за преодоляването на това препятствие. „Използването на графична среда за разработването на тези процеси би трябвало да улесни и ускори създаването на кода, необходим за статистическия анализ на данните“, казва той в блог.

HParser идва скоро, след като през юни Informatica пусна Hadoop конектор, адресиращ местенето на данни към и от Hadoop клъстер.

Hadoop се превърна в една от технологиите с най-висок профил, асоциирани с т. нар. „големи данни“, модерната фраза, описваща големи количества неструктурирана информация, генерирана от уеб сайтове, сензори, мобилни устройства и други нерелационни източници.

IDG News Service Бостън





© Ай Си Ти Медиа ЕООД 1997-2019 съгласно Общи условия за ползване

X