Himansu Sekhar – Medium

Himansu Sekhar
in
road to data engineering

Stream Data from Kinesis to Databricks with Pyspark

Streaming with AWS Kinesis and Databricks

4 min readJan 5, 2021

--

5

Stream Data from Kinesis to Databricks with Pyspark

--

5

Himansu Sekhar
in
road to data engineering

Databricks Notebook Promotion using Azure DevOps

Productionize Databricks Notebooks

6 min readJan 3, 2021

--

3

Databricks Notebook Promotion using Azure DevOps

--

3

Himansu Sekhar
in
road to data engineering

Spark Performance Optimization Series: #3. Shuffle

Apache Spark optimization techniques for better performance

3 min readDec 29, 2020

--

2

Spark Performance Optimization Series: #3. Shuffle

--

2

Himansu Sekhar
in
road to data engineering

Spark Performance Optimization Series: #2. Spill

Apache Spark optimization techniques for better performance

3 min readDec 28, 2020

--

1

Spark Performance Optimization Series: #2. Spill

--

1

Himansu Sekhar
in
road to data engineering

Spark Performance Optimization Series: #1. Skew

In Spark cluster data is typically read in as 128 MB partitions which ensures even distribution of data. However, as the data is…

3 min readDec 27, 2020

--

Spark Performance Optimization Series: #1. Skew

--

Himansu Sekhar

Kubernetes Architecture,Hands On!

You need to learn Kubernetes right now!!!! But Why??? Well Kubernetes can deploy hundreds of containers with just one command and it is…

7 min readNov 25, 2020

--

Kubernetes Architecture,Hands On!

--

Himansu Sekhar

Himansu Sekhar

Data Engineering | DevOps | DataOps | Distributed Computing

Following

Help
Status
About
Careers
Blog
Privacy
Terms
Text to speech
Teams