Databricks
Azure Databricks란?
Azure Databricks는 오픈소스 아파치 스파크(Apache Spark) 기반의 분석 플랫폼으로,
Python, Scala, R, Java 및 SQL뿐 아니라 TensorFlow, PyTorch, scikit-learn 등을 비롯한 데이터 과학 프레임워크와 라이브러리도 지원합니다.
Python, Scala, R, Java 및 SQL뿐 아니라 TensorFlow, PyTorch, scikit-learn 등을 비롯한 데이터 과학 프레임워크와 라이브러리도 지원합니다.
빠르고 최적화된 Apache Spark 환경
인기 있는 도구, 언어, 프레임워크를
기본적으로 지원하는 대화형 작업 영역
기본적으로 지원하는 대화형 작업 영역
네이티브 Azure Machine Learning 통합을
사용하는 빅데이터 기반의 강력한 기계 학습
사용하는 빅데이터 기반의 강력한 기계 학습
Azure SQL Data Warehouse와 함께 사용
되는 고성능 최신 데이터 웨어하우징
되는 고성능 최신 데이터 웨어하우징
Azure Databricks 특징
-
Azure의 first-party 서비스클라우드 컴퓨팅은 직원 채용, 부지, 건물, 다른 클라우드와 달리,
Azure Marketplace나 3rd party 호스팅 서비스가 아닙니다. -
별도의 계정 불필요Databricks를 사용하여 별도의 계정을 만들 필요가 없습니다
-
Azure Service와의 완벽한 통합Azure Portal : Azure Portal에서 직접 서비스를 시작할 수 있습니다.Azure Storage Services : Azure Blob Storage와 Azure Date Lake Store 데이터에 직접 액세스할 수 있습니다.Azure Active Directory : 사용자 인증을 위해, Databricks와 Azure에서 별도의 두 가지 세트를 유지할 필요가 없습니다.Azure SQL DW and Azure Cosmos DB : 분석을 위해 정형 데이터, 비정형 데이터를 결합할 수 있습니다.Apache Kafka for HDInsight : Kafka를 스트리밍 데이터나 싱크로 사용할 수 있습니다.Azure Billing(단일 청구서)Azure Power BI(풍부한 데이터 시각화)
Advanced Analytics Pattern In Azure
Collect data Into-term storage and explore
Steam analytics scenarios
Real-Time fraud detection
Fleet management and connected cars
Click-stream analysis
Real-time patient monitoring
Smart grid
Customer behavior in stores
IT Infrastructure and Networking monitoring
Real-Time demand and inventory management
IoT Scenarios
산업 전반에 걸친 IoT별 분석 시나리오
Phone tracking across cell sites
Geo fencing
Connected cars-remote
management and diagnostics
management and diagnostics
Fleet management
Asset tracking
Facilities management
Personnel tracking and
crowd control
crowd control
Race car telemetry
Ride sharing
Connected manufacturing