Kapan Akhirnya Para pendiri Sammy Sidhu dan Jay Chia bekerja sebagai insinyur perangkat lunak dalam program kendaraan otonom Lyft, mereka menyaksikan masalah infrastruktur data pemrosesan data, yang hanya akan menjadi lebih besar dengan peningkatan AI.
Mobil otonom menghasilkan satu ton data pemindaian yang tidak terstruktur dan foto 3D sampai mengirim pesan teks dan audio. Tidak ada alat untuk insinyur Lyft yang dapat memahami dan memproses semua jenis data yang berbeda pada saat yang sama, dan semua di satu tempat. Ini membuat insinyur mengumpulkan alat sumber terbuka dalam proses panjang dengan masalah keandalan.
“Kami memiliki semua doktor yang cemerlang ini, orang -orang yang brilian di seluruh industri, bekerja di kendaraan otonom, tetapi mereka menghabiskan sekitar 80% dari waktu mereka mengerjakan infrastruktur alih -alih membangun aplikasi utama mereka,” kata Sidhu, CEO akhirnya, untuk TechCrunch dalam sebuah wawancara baru -baru ini. “Dan sebagian besar masalah yang mereka hadapi ada di sekitar infrastruktur data.”
Sidhu dan Chia membantu membangun alat internal untuk pemrosesan data multimodal untuk Lyft. Ketika Sidhu berangkat untuk mencalonkan diri untuk karya -karya lain, ia menemukan bahwa pewawancara terus bertanya kepadanya tentang potensi penciptaan solusi data yang sama untuk perusahaan mereka, dan idenya lahir di belakang akhirnya.
Akhirnya membangun pemrosesan data sumber terbuka asli Python, yang dikenal sebagai DAFT, yang dirancang untuk berjalan dengan cepat dalam modalitas yang berbeda, dari teks ke audio dan video, dan banyak lagi. Sidhu mengatakan tujuannya adalah untuk membuat infrastruktur data yang tidak terstruktur transformatif untuk data yang tidak terstruktur seperti set data tabel di masa lalu.
Perusahaan ini didirikan pada awal 2022, hampir setahun sebelum chatgpt diluncurkan, dan sebelum banyak orang mengetahui kesenjangan infrastruktur data ini. Mereka meluncurkan versi open source pertama DAFT pada tahun 2022 dan bersiap untuk meluncurkan produk bisnis pada kuartal ketiga.
“Ledakan chatgpt, yang kami lihat hanyalah banyak orang lain yang kemudian membangun aplikasi AI dengan berbagai jenis modalitas,” kata Sidhu. “Lalu semua orang memulai sesuatu seperti menggunakan hal -hal seperti gambar, dokumen, dan video dalam aplikasi mereka. Dan di situlah kami hanya melihat penggunaan [increase] secara dramatis. “
Sementara ide asli di balik konstruksi DAFT muncul dari ruang kendaraan otonom, ada banyak industri lain yang memproses data multimodal, termasuk robotika, teknologi ritel, dan perawatan medis. Perusahaan sekarang memberi tahu Amazon, Cloudkitchens dan bersama -sama, AI, antara lain, sebagai pelanggan.
Akhirnya baru -baru ini mengumpulkan dua putaran pembiayaan dalam delapan bulan. Yang pertama adalah putaran benih $ 7,5 juta yang diarahkan oleh CRV. Baru -baru ini, perusahaan mengumpulkan putaran seri A $ 20 juta yang diarahkan oleh Felicis dengan partisipasi Microsoft M12 dan Citi.
Babak terakhir ini akan digunakan untuk penawaran open source pada akhirnya, serta untuk membuat produk komersial yang akan memungkinkan pelanggannya untuk mengembangkan aplikasi AI dari data yang diproses ini.
Astasia Myers, mitra umum Felicis, mengatakan kepada TechCrunch bahwa ia menemukan akhirnya melalui latihan pemetaan pasar yang melibatkan mencari infrastruktur data yang dapat mendukung meningkatnya jumlah model AI multimodal.
Myers mengatakan bahwa akhirnya menonjol karena menjadi mesin pertama di ruang angkasa, yang mungkin akan diisi lebih banyak, dan berdasarkan fakta bahwa para pendiri telah memperlakukan masalah pemrosesan data hand pertama ini. Dia menambahkan bahwa akhirnya juga memecahkan masalah yang berkembang.
Diperkirakan bahwa industri AI multimodal akan tumbuh di a Senyawa tingkat pertumbuhan tahunan sebesar 35% Antara 2023 dan 2028, menurut perusahaan konsultan manajemen pasar dan pasar.
“Pembuatan data tahunan meningkat 1.000x dalam 20 tahun terakhir dan 90% dari data dunia dihasilkan dalam dua tahun terakhir, dan menurut IDC, sebagian besar data tidak terstruktur,” kata Myers. “Daft menyesuaikan dengan tren makro besar generatif yang sedang dibangun di sekitar teks, gambar, video, dan suara. Ini membutuhkan mesin pemrosesan data asli multimodal.”