Lisensya ng Mataas na kalidad na Data ng Pangangalagang Pangkalusugan/Medikal para sa Mga Modelong AI at ML
Mga Off-the-shelf na Healthcare/Medical Dataset para simulan ang iyong proyekto sa Healthcare AI
Isaksak ang data source na nawawala sa iyo ngayon
Mga dataset ng Medikal at Pangangalagang Pangkalusugan para sa Machine Learning
Data ng Audio sa Pagdidikta ng Doktor
Kasama sa aming na-de-identify na dataset para sa pangangalagang pangkalusugan ang 31 iba't ibang specialty na mga audio file na idinidikta ng mga doktor na naglalarawan sa klinikal na kondisyon at plano ng pangangalaga ng mga pasyente batay sa mga nakatagpo ng doktor-pasyente sa klinikal na setting.
Off-the-Shelf Physician Dictation Audio Files:
- 257,977 oras ng Real-world Physician Dictation Speech Dataset mula sa 31 specialty para sanayin ang mga modelo ng Healthcare Speech
- Dictation audio na nakunan mula sa iba't ibang device tulad ng Telephone Dictation (54.3%), Digital Recorder (24.9%), Speech Mic (5.4%), Smart Phone (2.7%) at Unknown (12.7%)
- PII Redacted Audio at Transcripts na sumusunod sa Safe Harbor Guidelines alinsunod sa HIPAA
Na-transcribe na Mga Rekord na Medikal
Ang mga na-transcribe na medikal na rekord ay tumutukoy sa transkripsyon ng pag-uusap ng doktor at pasyente, transkripsyon ng mga medikal na ulat at medikal na pagtatasa. Nakakatulong ito sa pagmamapa ng medikal na kasaysayan ng pasyente para sa mga pagbisita sa hinaharap at nagsisilbi ring reference point para sa mga doktor. Nakakatulong ito na suriin ang kasalukuyang kalagayan ng pasyente at magmungkahi ng angkop na paggamot.
Off-the-Shelf na Transcribe na Mga Rekord na Medikal:
- Transkripsyon ng 257,977 oras ng Real-world Physician Dictation mula sa 31 specialty para sanayin ang mga modelo ng Healthcare Speech
- Na-transcribe na Mga Rekord na Medikal mula sa iba't ibang uri ng trabaho tulad ng Operative Report, Discharge Summary, Consultation Note, Admit Note, ED Note, Clinic Note, Radiology Report, atbp.
- PII Redacted Audio at Transcripts na sumusunod sa Safe Harbor Guidelines alinsunod sa HIPAA
Electronic Health Records (EHR)
Ang Electronic Health Records o EHR ay mga medikal na rekord na naglalaman ng kasaysayan ng medikal ng pasyente, mga diagnosis, reseta, mga plano sa paggamot, mga petsa ng pagbabakuna o pagbabakuna, mga allergy, mga larawan sa radiology (CT Scan, MRI, X-Ray), at mga pagsusuri sa laboratoryo at higit pa.
Off-the-Shelf Electronic Health Records (EHR):
- 5.1M+ Records at mga audio file ng doktor sa 31 specialty
- Real-world gold-standard na mga medikal na rekord upang sanayin ang Clinical NLP at iba pang mga modelo ng Document AI
- Ang impormasyon ng metadata tulad ng MRN (Anonymized), Petsa ng Pagpasok, Petsa ng Paglabas, Mga araw ng Haba ng Pananatili, Kasarian, Klase ng Pasyente, Nagbabayad, Klase sa Pananalapi, Estado, Discharge Disposition, Edad, DRG, Paglalarawan ng DRG, $ Reimbursement, AMLOS, GMLOS, Panganib ng mortalidad, Kalubhaan ng sakit, Grouper, Hospital Zip Code, atbp.
- Mga Rekord na Medikal mula sa iba't ibang estado at rehiyon ng US- North East (46%), South (9%), Midwest (3%), West (28%), Iba pa (14%)
- Mga Rekord na Medikal na kabilang sa lahat ng Klase ng Pasyente na sakop- Inpatient, Outpatient (Clinical, Rehab, Recurring, Surgical Day Care), Emergency.
- Mga Rekord na Medikal na kabilang sa lahat ng Pangkat ng Edad ng Pasyente <10 yrs (7.9%), 11-20 yrs (5.7%), 21-30 yrs (10.9%), 31-40 yrs (11.7%), 41-50 yrs (10.4% ), 51-60 yrs (13.8%), 61-70 yrs (16.1%), 71-80 yrs (13.3%), 81-90 yrs (7.8%), 90+ yrs (2.4%)
- Patient Gender ratio na 46% (Lalaki) at 54% (Babae)
- PII Redacted Documents na sumusunod sa Safe Harbor Guidelines alinsunod sa HIPAA
Dataset ng Larawan ng CT Scan
Gumagamit ang mga doktor ng CT scan na imahe upang masuri at tuklasin ang mga abnormal o normal na kondisyon sa katawan ng isang pasyente. Sa computerized image processing diagnosis, ang isang CT-scan na imahe ay dumaan sa mga sopistikadong yugto, viz., acquisition, image enhancement, extraction ng mahahalagang feature, Region of Interest (ROI) identification, result interpretation, atbp.
Nagbibigay ang Shaip ng mataas na kalidad na mga dataset ng imahe ng CT scan na mahalaga para sa pananaliksik at medikal na diagnosis. Kasama sa aming mga dataset ang libu-libong larawang may mataas na resolution na nakolekta mula sa mga totoong pasyente at pinoproseso gamit ang mga makabagong diskarte. Idinisenyo ang mga dataset na ito upang tulungan ang mga medikal na propesyonal at mananaliksik na mapabuti ang kanilang kaalaman at pag-unawa sa iba't ibang kondisyong medikal, kabilang ang cancer, neurological disorder, at cardiovascular disease.
Dataset ng Larawan ng MRI
Ang mga modelo ng computer vision ay idinisenyo upang makakuha ng makabuluhang impormasyon mula sa mga digital na larawan at video. Nagbibigay-daan ito sa malawakang paggamit ng data ng imahe ng pangangalagang pangkalusugan upang magbigay ng mas mahusay na diagnosis, paggamot, at paghula ng mga sakit. Maaari itong gumamit ng konteksto mula sa pagkakasunud-sunod ng larawan, texture, hugis, at contour na impormasyon, pati na rin ang nakaraang kaalaman, upang makagawa ng 3D at 4D na impormasyon na nakakatulong sa pinahusay na pag-unawa ng tao. Tulad ng mga CT scan, ginagamit din ang mga MRI upang masuri at makita ang mga abnormal o normal na kondisyon sa katawan ng isang pasyente (ibig sabihin, upang matukoy ang sakit o pinsala sa loob ng iba't ibang bahagi ng katawan).
Nagbibigay ang Shaip ng mataas na kalidad na mga dataset ng imahe ng MRI mula sa mga totoong pasyente at pinoproseso gamit ang mga makabagong pamamaraan.
X-Ray Image Dataset
Ang pagsusuri sa X-ray ay ginagamit upang i-verify ang panloob na istraktura at integridad ng bagay. Ang mga larawan ng X-ray ng isang bagay na pansubok ay maaaring mabuo sa iba't ibang posisyon at iba't ibang antas ng enerhiya upang masuri at matukoy ang mga abnormal na kondisyon sa katawan ng isang pasyente.
Nagbibigay ang Shaip ng mataas na kalidad na mga dataset ng larawan ng X-Ray na mahalaga para sa pananaliksik at medikal na diagnosis. Kasama sa aming mga dataset ang libu-libong larawang may mataas na resolution na nakolekta mula sa mga totoong pasyente at pinoproseso gamit ang mga makabagong diskarte. Sa Shaip, maaari mong ma-access ang maaasahan at tumpak na medikal na data upang mapahusay ang iyong pananaliksik at mapabuti ang mga resulta ng pasyente.
Hindi mahanap ang iyong hinahanap?
Ang mga bagong off-the-shelf na medikal na dataset ay kinokolekta sa lahat ng uri ng data
Makipag-ugnayan sa amin ngayon para mawala ang iyong mga alalahanin sa pangongolekta ng data sa pagsasanay sa pangangalagang pangkalusugan
Mga Madalas Itanong (FAQ)
1. Ano ang mga medikal na dataset?
Kasama sa mga medikal na dataset ang data ng pangangalagang pangkalusugan gaya ng pagdidikta ng doktor, mga na-transcribe na tala, EHR, at mga medikal na larawan (CT, MRI, X-ray) na ginagamit upang sanayin ang mga modelo ng AI.
2. Ang data ba ay sumusunod sa mga regulasyon sa pangangalagang pangkalusugan?
Oo, ang mga dataset ay sumusunod sa mga regulasyon sa pangangalagang pangkalusugan gaya ng HIPAA at GDPR para matiyak ang secure at etikal na paggamit ng data.
3. Maaari bang ipasadya ang mga dataset para sa mga partikular na pangangailangan?
Oo, maaaring iayon ang mga dataset batay sa mga partikular na specialty, demograpiko, format ng data, at mga kinakailangan sa proyekto.
4. Paano gumagana ang katiyakan ng kalidad para sa mga dataset na ito?
Ang data ay sumasailalim sa mahigpit na pagsusuri sa kalidad, kabilang ang mga anotasyon ng mga eksperto sa domain, upang matiyak ang katumpakan at pagiging maaasahan. Ang bawat dataset ay idinisenyo upang matugunan ang mga kinakailangan sa pamantayang ginto.
5. Nasusukat ba ang mga dataset na ito para sa malalaking proyekto ng AI/ML?
Oo, ang mga dataset ay nasusukat upang matugunan ang maliit at malalaking kinakailangan ng proyekto, kabilang ang milyun-milyong record o oras ng audio.
6. Maaari bang maisama ang mga dataset na ito sa mga kasalukuyang modelo ng AI?
Oo, ibinibigay ang mga dataset sa mga format na handa nang gamitin (hal., JSON, CSV) para sa tuluy-tuloy na pagsasama sa mga umiiral nang AI at ML workflow.
7. Magkano ang halaga ng mga medikal na dataset?
Nakadepende ang gastos sa mga salik tulad ng uri ng dataset, dami, pag-customize, at mga timeline ng paghahatid. Mangyaring punan ang form na "Makipag-ugnayan sa Amin" kasama ang iyong mga kinakailangan para sa isang quote.
8. Gaano katagal bago maghatid ng mga dataset?
Nag-iiba-iba ang mga timeline ng paghahatid batay sa pagiging kumplikado ng proyekto at laki ng dataset, ngunit nakabalangkas upang matugunan ang mga deadline ng iyong proyekto.
9. Bakit mahalaga ang mga medikal na dataset para sa AI/ML?
Ang mga de-kalidad na medikal na dataset ay mahalaga para sa pagsasanay ng mga modelo ng AI upang mapabuti ang katumpakan, i-automate ang mga gawain, at mapahusay ang paggawa ng desisyon sa pangangalagang pangkalusugan.