Big Data 1-2 펀치 : Hortonworks 및 Greenplum과의 Syncsort 파트너

[캡션 ID = “attachment_589″align = “alignright”width = “457”캡션 = “Syncsort UI가 야만적 인 MapReduce 짐승을 괴롭힘”]; [/ caption]

메인 프레임에서 하둡 클러스터에 이르기까지, 1960 년대 고속 분류 기술로 메인 프레임 공간에서 시작하여 지난 10 년 동안 ETL (Extract, Transform and Load) 데이터 통합 ​​공간으로 확장 한 Syncsort는 이 두 가지 Hadoop Summit 현상과 관련이 있습니다. 6 월 14 일 Hortonworks와의 파트너십을 발표했습니다. Hortonworks는 Syncsort의 DMExpress Data Integration 플랫폼에 Hadoop / HDP를 제공합니다.

이 파트너십을 통해 Hadoop과 HDFS (Hadoop Distributed File System)가 기업 데이터 워크 플로우에 통합되어 엔터프라이즈 데이터 전문가가 현재의 기술 세트를 적용하여이를 활용할 수 있습니다. 데이터 통합 ​​플로우 (그림) 개발을위한 Syncsort의 그래픽 사용자 인터페이스를 이제 Hadoop의 프론트 엔드로 사용할 수 있습니다. 기본 Hadoop 스킬 셋이 엔터프라이즈에서 주류가 되더라도 Hadoop이 오늘날 주류 인 스킬 셋에서 사용 가능해질 때까지는 발생하지 않습니다.

운전자뿐만 아니라이 파트너십에 대한 또 다른 주목할만한 점은 통합의 배후에있는 엔지니어링입니다. Syncsort는 다양한 정원 하이브 (Hive) 드라이버 연결성을 훨씬 능가하는 대신 DMExpress는 HDFS 및 Hadoop의 MapReduce 프레임 워크와 긴밀하게 통합됩니다. DMExpress는 HDFS 파일로 직접 작업 할 수 있으며 고도로 최적화 된 정렬 루틴을 MapReduce 작업에 통합 할 수 있습니다. 후자의 기능은 플러그 가능한 정렬 인프라를 Map 및 Reduce 작업과 Hadoop이 조율하는 Syncsort의 자체 오픈 소스 코드에서 비롯됩니다.

Hortonworks와의 파트너십이 중요하고 독자적으로 나서기 때문에이 게시물을 끝낼 수 있습니다. 그러나 나는 오늘 줄거리가 두껍게되기 때문에 계속할 것입니다.

MPP (Massively Parallel Processing) 데이터웨어 하우스 어플라이언스는 Big Data 기술이기도합니다. Hadoop은 Big Data를 만들지 않습니다.

또한 읽으십시오 : MapReduce와 MPP : 큰 자료 동전의 2 개의 측?

현재 Syncsort는 MPP 어플라이언스 (그리고 EMC 부서)의 제조업체 인 그린 플럼 (Greenplum)과 파트너십을 맺고 있기 때문에 Syncsort가 동의 할 것으로 보인다. 이번 파트너쉽은 Greenplum이 DMExpress의 인증 된 데이터 엔드 포인트라는 것을 의미하며, 갑자기 Hadoop, MPP 및 트랜잭션 데이터베이스가 데이터 이동 영역에 있습니다. Syncsort는 Greenplum의 “Catalayst”개발자 프로그램에 합류하여 양사의 기술자가 흥미로운 솔루션을 공동 작업 할 수있게 해줍니다.

클라우드 : 마이클 델, VM웨어 이사회 의장 자리 잡기, 가상화, VM웨어가 vSphere를 보완, 호라이즌, 워크 스페이스 ONE 제품 업데이트, 스토리지, 스토리지가 안쪽 : SAN의 기능이 아닌 서버 내부, 스토리지, EMC Q2 판매가 앞당겨 짐 델 합병안 투표 결과

세상이 충돌하고 둘 다 생존하며 Synctort의 데이터 통합 ​​제품 관리 이사 인 Keith Kohl에게 Hortonworks와 같은 Hadoop 플레이어와 Greenplum과 같은 MPP 플레이어와 협력하는 이유를 물었습니다. 특히 엔터프라이즈 스토리지 혈통 Greenplums의 모회사.

Kohl의 답변은 매우 중요했습니다. Syncsort의 고객은 MPP와 Hadoop 기술을 나란히 사용하고 있습니다. 콜 (Kohl)은 이러한 고객 (comScore)에 대한 구체적인 예를 들었지만 시나리오가 보편적이라고 설명했습니다. 기업 고객은 Hadoop을 데이터 환경에 통합하고 있지만 인프라 및 기술 집합 투자를 데이터웨어 하우스 플랫폼에 활용할 수있는 방식으로 Hadoop을 통합하고 있습니다.

“빅 데이터”및 “하나의 버전의 진실”개념은 교차 목적 일 필요는 없습니다. 콜 (Kohl)은 위험, 기술 집합 및 시장 성숙이 이러한 추세의 중요한 원동력이라고 말합니다. 필자 : 중단은 과소 평가되어서는 안되지만, 찢어 지거나 교체해야하는 것이 과장되어서는 안됩니다.

Michael Dell, VMware 이사회에 의장 자리 잡고

VMware, vSphere 보완, Horizon, Workspace ONE 제품 업데이트

스토리지는 내부를 바라 봅니다 : 오늘날의 행동은 SAN 내부가 아닌 서버 내부입니다.

델 합병 투표에 앞선 EMC Q2 판매