掌握結構化與非結構化商用數據

探勘數據金礦 提升企業未來競爭優勢


Informatica 大數據管理方案,以大數據資整合、大數據治理與大數據安全為管理基礎架構的協同工作,提供企業由管理介面透過整合與分析新數據類型及數據源迅速開發新產品和服務,並經此管理方案降低數據管理成本與營運風險。

數據整合機制,我們提供訪問、解析、標準化、整合、準備、交付和管理數據,在Hadoop 分散式計算平台進行性能擴展且無需特殊編碼,只需使用相同的Informatica開發工具即可達到目的。


結構化與非結構化數據一手掌握

Informatica 大數據管理方案支援多種資料型態,包含結構性資料、半結構性資料與非結構資料,例如:交易資料、應用程式資料、網路日誌(Log File)、社交軟體資訊(Facebook 、Twitter、Linkin)、機器與感應器(Sensor)的資料。


高速資料導入和提取

高效能地連接與機動式的比對在源系統(Source system)與目標系統之間或直接在Hadoop訪問、加載、複製、轉換和提取大數據。用並行處理實現本地API到源系統和目標系統的高性能連接,確保大數據的高速導入和提取。


在Hadoop 上的數據提取、轉換和加載(ETL)

透過視覺化的圖形開發環境迅速地開發數據流,以提高工作效和促進重複利用。提供數據類型轉換和字符串操作、高效能緩衝查找、連接器、排序器、路由器與聚合等等。


在Hadoop上的優越數據應用

  • 數據剖析在Hadoop 上以瞭解資料型態、鑑別資料品質與協同應用
  • 自動化在Hadoop上發現數據範圍與關係如發現敏感資料需被保護
  • 數據清洗、標準化,並使用一套廣泛的預設數據質量規則,包括地址驗證以充實Hadoop的數據
  • 使用自然語言處理,以識別和分類文本中的實體,例如:文件檔案和社交媒體
  • 使用預設解析器解析或是自建規則以在Hadoop上處理複雜,多結構化,非結構化和業界標準的數據
  • 提供完整的透明度與源數據的所有數據的移動,通過Hadoop的端至端的數據沿襲,到目標應用程序
  • 脫敏與此選項去識別敏感數據,同時保持參照完整性,所以你可以使用測試,分析,或支持的環境中屏蔽數據
  • 建立在 Open-source Hadoop架構之上,一次設計和部署速度更快,並保留您的數據管道中的所有轉換邏輯



  • 業務窗口

    陳先生
    電話:02-8752-3566 #1639
    郵件:joe.chen@taifon.com.tw