Този сайт използва бисквитки (cookies). Ако желаете можете да научите повече тук. Разбрах
IDG  •  PC World  •  Computerworld  •  CIO  •  CFO  •  Networkworld  •  Дискусии  •  Кариерна зона  •  Събития
COMPUTERWORLD | Софтуер
03 ное
2011
 
 

Informatica пусна парсер за Hadoop

HParser идва скоро, след като през юни Informatica пусна Hadoop конектор, адресиращ местенето на данни към и от Hadoop клъстер

4343 прочитания

HParser включва набор от библиотеки за различни типове данни – от стандарти като XML до индустриално специфични формати като HIPAA в здравеопазването или ASN.1 в телекомуникациитеInformatica пусна на 2 ноември парсерът за данни HParser за Hadoop, програмната рамка с отворен код за обработка на големи количества информация. Синтактичният анализатор може да трансформира неструктурирани данни в по-структурирана форма, за да бъдат използвани в Hadoop.

HParser включва набор от библиотеки за различни типове данни – от стандарти като XML до индустриално специфични формати като HIPAA в здравеопазването или ASN.1 в телекомуникациите.

Продуктът идва в три издания, две от които са комерсиални – HParser Industry Standards и HParser for Documents, а другото в community версия, която е безплатна, но за премиум услуги и адони се заплаща. Също така Informatica обяви, че community версията на HParser ще бъде налична за употреба и ще може да се сваля от сайта на Hortonworks, която е част от Yahoo.

Според Дейвид Менингър, вицепрезидент и директор за проучванията във Ventana Research, една от големите пречки пред Hadoop е, че много ИТ компании нямат уменията да започнат да работят с рамката, но HParser може да помогне за преодоляването на това препятствие. „Използването на графична среда за разработването на тези процеси би трябвало да улесни и ускори създаването на кода, необходим за статистическия анализ на данните“, казва той в блог.

HParser идва скоро, след като през юни Informatica пусна Hadoop конектор, адресиращ местенето на данни към и от Hadoop клъстер.

Hadoop се превърна в една от технологиите с най-висок профил, асоциирани с т. нар. „големи данни“, модерната фраза, описваща големи количества неструктурирана информация, генерирана от уеб сайтове, сензори, мобилни устройства и други нерелационни източници.

IDG News Service Бостън

НАЙ-НОВИ НАЙ-ЧЕТЕНИ ПРЕПОРЪЧАНИ

Слайдшоу
ИНТЕРВЮ
Рей О’Фаръл, VMware: Светът на облаците ще е хибриденРей О’Фаръл, VMware: Светът на облаците ще е хибриден

Техническият директор на компанията е уверен, че публичните услуги няма да заменят собствените сървъри.

ПРИЛОЖЕНИЯ
АНКЕТА

Какво мислите за FireFox OS?

Информация за Вас