メインコンテンツへジャンプ

過去3ヶ月間、DatabricksのIngestionチームで製品管理インターンとして働く機会がありました。この期間中、私はデータレイクハウスアーキテクチャの理解を深める大規模で深く技術的なプロジェクトに取り組みました。私は、LakeFlow ConnectAuto LoaderCOPY INTOのような革新的な技術が、幅広いデータ形式とソースから効率的にデータを取り込む方法について、深く理解を深めることができました。この経験は、Databricksの文化的な原則が顧客のニーズを特定し、影響力のある解決策を作り出し、それを成功裏に市場に提供する能力を高めることで、私のプロダクトマネージャーとしての成長に変革をもたらしました。

Databricks Ingestionチーム

データの取り込みは、よくデータインテリジェンスプラットフォームへのゲートウェイとなります。それはデータを単純かつ効率的に取り込むことに焦点を当てており、それがUnity CatalogWorkflowsなどの他のDatabricksツールと統一されています。このようにして、データは分析、機械学習、その他の多くのダウンストリームアプリケーションのために利用可能になります。

問題の定義

Databricksプラットフォームを使用するほぼすべての顧客に対する私たちの仕事の潜在的な影響を考えると、私は高品質な結果を提供するために駆り立てられました。私は、Databricksの中心的な文化原則である顧客への執着に焦点を当てて始めました。私は、ほぼ30の顧客と会い、彼らのワークロード、Jobs To Be Done (JTBD)、プラットフォームへの要望について学ぶ機会を得ました。これらの仮説に基づいた議論を通じて、私は顧客が湖畔に何十億ものファイルを取り込むために設定したさまざまなアーキテクチャについての洞察を得ました。Databricksへのデータ取り込みが、ダッシュボードの生成や、組織向けのカスタムAIチャットボットの開発など、重要なユースケースをサポートすることを観察しました。

顧客体験の定義

私の役割の主要な側面は、顧客から得たデータを通じて洞察を明確かつ簡潔に文書化することでした。これには、ステップバイステップのユーザージャーニーを改善し、顧客のフィードバックを統合し、競合他社を分析することが含まれていました。最初の原則から始めて、鋭いエッジを取り除く機会を探し、ステップ数とコンテキストスイッチを減らし、可能な限り設定を自動化しました。これらのドキュメントがリーダーシップの間で高い可視性を持っていることを考えると、CEOから直接フィードバックを受けることもありますが、明確で簡潔なドキュメンテーションが重要でした。

その過程で、私はチームの世界クラスのエンジニアと密接に協力し、「二人一組」の方式で働きました。これにより、私は顧客からの洞察と彼らの深い技術的専門知識を組み合わせるだけでなく、自分自身のデータエンジニアリングシステムに対する理解を向上させることができました。そして、私たちが設計した解決策を検証するために、補完的なチームの優れたエンジニアとプロダクトマネージャーから広範なフィードバックを集めました。最後に、私はUI/UXデザイナーと密接に協力して、これらの洞察を直感的なインターフェースに翻訳しました。

コネクションの構築

この報酬的な仕事を超えて、私のインターンシップは、サンフランシスコを探索し、他のインターンと絆を深めることができる忘れられない経験で満ちていました。私は初めてメジャーリーグの野球ゲームを観戦し、サンフランシスコジャイアンツを応援し、エクスプロラトリウムの興味深い展示を訪れ、ベイエリアのR&Dクルーズを楽しみました(ここで私たちPMインターンはコーンホールトーナメントで2位を獲得しました)。そのような才能あふれる素晴らしい人々との関係を築くことは、私の最後の大学インターンシップに特別な次元を加え、夏をさらに楽しいものにした永続的な思い出を作り出しました。

大規模データ取り込みの最適化方法

まとめ

Databricksでのインターンシップは、挑戦的でありながらも報われる経験でした。私は深い技術的洞察を得て、コミュニケーションスキルを磨き、クロスファンクショナルな協力関係で活躍しました。これらの経験は私のスキルを磨き、プロダクトマネジメントへの情熱を燃え上がらせました。私は学んだことを将来の機会に活用し、このダイナミックな分野での成長を続けることに興奮しています。

業界のリーダーとともに最先端のプロジェクトに取り組みたい場合は、Databricksでの仕事に応募することを強くお勧めします!Databricks Careersページを訪れて、会社全体での求人情報を詳しく学んでください。または、データ取り込みプロセスを効率化する準備ができているなら、LakeFlow Connectがどのように実践者が大規模にデータパイプラインを実装できるようにするかを探索してみてください。

Databricks 無料トライアル

関連記事

Databricksノートブックの画像:私の鮮やかな夏のインターンシップ

August 30, 2024 ケネス・チョイ による投稿 in
このブログ投稿を書いている時点で、私はDatabricksの探索的データ分析(EDA)チームでの夏のインターンシップが終わるまであと一週間です。夏がこんなに早く過ぎ去ったなんて信じられません。まるで昨日のことのように、私がチームのリポジトリをクローンし、オンボーディングの仲間に助けを求めていたように感じます!12週間の間に、私は一つのテーマを基にした三つのプロジェクトフェーズを完成させました:Databricksノートブックで画像を操作するユーザーエクスペリエンスを改善すること。 Databricksノートブック あなたがコードを通じてデータと交流したことがあるなら、おそらくノートブックを使用したことがあるでしょう。ノートブックはPython、SQL、Scala、Rのコードエディタの一種で、データサイエンスや機械学習でデータを抽出し使用する手段として一般的です。データ+AIの会社として、Databricksはプラットフォームと深く統合された独自のノートブックを顧客に提供しています。 Databricksノートブッ
Databricks ブログ一覧へ