Mga Dataset ng Audio ng Pagdidikta ng Doktor para sa Healthcare AI
I-access ang 257,977 Oras ng Medikal na Audio Data sa 31 Specialty
Isaksak ang data source na nawawala sa iyo ngayon
Mga Dataset ng Audio Dictation ng Doktor para sa Machine Learning
Kasama sa aming na-de-identify na dataset para sa pangangalagang pangkalusugan ang 31 iba't ibang specialty na audio file na idinidikta ng mga doktor na naglalarawan sa klinikal na kondisyon ng mga pasyente at plano ng pangangalaga batay sa mga nakatagpo ng doktor-pasyente sa setting ng ospital/klinikal.
Off-the-Shelf Physician Dictation Audio Files:
- 257,977 oras ng Real-world Medical Audio Dataset mula sa 31 specialty para sanayin ang mga modelo ng Healthcare ASR
- Dictation audio na nakunan mula sa iba't ibang device tulad ng Telephone Dictation (54.3%), Digital Recorder (24.9%), Speech Mic (5.4%), Smart Phone (2.7%) at Unknown (12.7%)
- PII Redacted Audio at Transcripts na sumusunod sa Safe Harbor Guidelines alinsunod sa HIPAA
Data ng Medikal na Audio ayon sa Kasarian
Speciality | Mga Audio File ng Pasyente (Playtime sa Oras) | Kabuuang Bilang ng Mga Audio File |
---|---|---|
total | 257,977 | 5,172,766 |
Lalaki | 58,850 | 2,444,910 |
Babae | 113,406 | 1,290,900 |
Hindi kilala | 85,721 | 1,436,956 |
Data ng Medikal na Audio ayon sa Espesyalidad
Speciality | Mga Audio File ng Pasyente (Playtime sa Oras) | Kabuuang Bilang ng Mga Audio File |
---|---|---|
Pain Medicine | 1 | 11 |
Podiatric Surgery | 4 | 24 |
Plastic surgery - espesyalidad | 13 | 183 |
Sinabi ni Physician Asst. | 6 | 38 |
Physical Therapist | 114 | 1713 |
Physical Medicine & Rehabilitation | 1347 | 23523 |
Pedyatrya | 877 | 9271 |
Pediatric surgery | 2 | 23 |
Espesyalidad ng pediatric | 35 | 682 |
Pediatric pulmonology | 4 | 40 |
Pediatric Dentistry | 15 | 420 |
Patolohiya | 1143 | 43462 |
PANP | 10760 | 145960 |
Podiatry | 892 | 12056 |
Sakit Pamamahala | 2 | 30 |
Otolaryngology | 995 | 19548 |
Osteopathic | 310 | 5566 |
Orthopedic | 4849 | 145053 |
Orthopedics at Sports Medicine | 149 | 3165 |
Operasyon sa bibig | 1 | 13 |
Oral at Maxillofacial Surgeon | 1 | 8 |
Optalmolohista | 609 | 19299 |
OPERATIVE CARE | 0 | 5 |
Oncology | 6816 | 82300 |
Occupational Therapist | 8 | 68 |
pagtitistis | 14431 | 236788 |
Sugat Care | 15 | 211 |
Vascular/General | 9 | 268 |
PAG-OOPERA SA UGAT | 19 | 156 |
Urolohiya | 3170 | 96934 |
Pagtitistis sa itaas na gastrointestinal | 4 | 58 |
Hindi kilala | 42269 | 748054 |
Trauma at orthopedics | 140 | 1308 |
Transplant | 3 | 32 |
Operasyong Thoracic | 4 | 37 |
Gamot sa thoracic | 5 | 27 |
Espesyalidad sa kirurhiko | 22 | 290 |
Katulong ng Doktor sa Surgery | 0 | 3 |
Occupational medicine | 79 | 763 |
sports Medicine | 3 | 49 |
Pagsasalita ng Therapy | 29 | 327 |
Rheumatology | 13 | 124 |
naninirahan | 46 | 641 |
Rehabilitasyon | 2515 | 30078 |
Radiology | 10962 | 630983 |
Pulmonary | 3809 | 64368 |
Psychotherapy (espesyalidad) | 50 | 229 |
Saykayatrya | 8871 | 70269 |
PANGUNAHING PAG-AALAGA | 1 | 7 |
preventive Medicine | 21 | 191 |
ng ngipin | 55 | 1233 |
Pangkalahatan | 26 | 313 |
Gastroenterology | 3127 | 62158 |
Family Practice | 262 | 2498 |
Family Nurse Practitioner | 424 | 9018 |
Family Medicine | 13639 | 263480 |
endokrinolohiya | 219 | 3212 |
Espesyalista sa Emergency Room | 30 | 378 |
Kagipitan | 3675 | 62256 |
Katulong ng Doktor sa ED | 0 | 70 |
Tenga, Ilong At Lalamunan | 51 | 658 |
Diagnostic Radiology | 255 | 7591 |
Dermatolohiya | 148 | 3474 |
Pangkalahatang pagsasanay sa ngipin | 2 | 25 |
Kritikal Care | 707 | 9645 |
Klinikal na pisyolohiya | 50 | 160 |
Klinikal na hematology | 0 | 2 |
Cardiothoracic surgery | 1 | 10 |
Cardiothoracic | 17 | 122 |
Kardyolohiya | 67504 | 1566721 |
APRN | 163 | 1693 |
Anesthetics | 1 | 9 |
Anesthesiology | 677 | 22280 |
Allergy at Immunology | 1152 | 22202 |
Aksidente at emergency | 9 | 359 |
IH-Industrial Health | 73 | 945 |
OB / GYN | 2424 | 42739 |
Nurse Practitioner – Pamilya | 9 | 113 |
Nurse Practitioner | 81 | 432 |
Neurosurgery | 86 | 755 |
Neurolohiya | 1476 | 17786 |
Neuro/TBI | 173 | 1157 |
Nephrology | 2431 | 39821 |
Gamot | 5 | 122 |
Medikal na oncology | 16 | 67 |
Internal Medicine, Pulmonary Medicine, Critical Care Medicine at Sleep Medicine | 5 | 102 |
Internal Medicine At Nephrology | 15 | 111 |
Internal Medicine | 42604 | 623072 |
total | 257,977 | 5,172,766 |
Hospitalist | 99 | 1493 |
Hospice & Palliative Medicine | 4 | 41 |
SIYA | 0 | 19 |
Hematology - Oncology | 22 | 394 |
Ginekolohiya | 4 | 25 |
GI | 55 | 550 |
Geriatric Medicine | 461 | 5323 |
Pangkalahatang operasyon | 237 | 2220 |
Pangkalahatang Surgeon | 27 | 893 |
Pangkalahatang Psychiatry | 3 | 36 |
Pangkalahatang gamot | 30 | 327 |
Data ng Medikal na Audio ayon sa Device
Speciality | Mga Audio File ng Pasyente (Playtime sa Oras) | Kabuuang Bilang ng Mga Audio File |
---|---|---|
total | 257,977 | 5,172,766 |
iPhone | 666 | 32,382 |
Digital recorder | 1,659 | 22,377 |
Mixed type | 69,818 | 1,408,679 |
smartPhone | 51,533 | 1,306,405 |
SpeechMic | 10,329 | 257,730 |
Pagdidikta sa Telepono | 120,867 | 2,071,557 |
Hindi kilala | 3,104 | 73,636 |
Nakikitungo kami sa lahat ng uri ng Data Licensing ie, text, audio, video, o imahe. Ang mga dataset ay binubuo ng mga Medikal na dataset para sa ML: Physician Dictation Dataset, Physician Clinical Notes, Medical Conversation Dataset, Medical Transcription Dataset, Doctor-Patient Conversation, Medical Text Data, Medical Images - CT Scan, MRI, Ultra Sound (collected basis custom requirements) .
Hindi mahanap ang iyong hinahanap?
Ang mga bagong off-the-shelf na medikal na dataset ay kinokolekta sa lahat ng uri ng data
Makipag-ugnayan sa amin ngayon para mawala ang iyong mga alalahanin sa pangongolekta ng data sa pagsasanay sa pangangalagang pangkalusugan
Mga Madalas Itanong (FAQ)
1. Ano ang data ng audio ng pagdidikta ng doktor?
Binubuo ang audio data ng pagdidikta ng doktor ng mga audio file kung saan inilalarawan ng mga doktor ang klinikal na kondisyon, plano ng paggamot, o kasaysayan ng medikal ng pasyente sa panahon ng mga konsultasyon o pagbisita sa ospital.
2. Bakit mahalaga ang data ng audio ng pagdidikta ng doktor para sa mga proyekto ng AI/ML?
Ang data na ito ay mahalaga para sa pagsasanay ng mga modelo ng AI sa speech recognition, natural language processing (NLP), at clinical documentation automation. Nakakatulong itong bumuo ng mga system para sa pag-transcribe, pagsusuri, at pagpapabuti ng mga workflow ng dokumentasyon ng pangangalagang pangkalusugan.
3. Anong mga uri ng mga medikal na data ng audio ang available?
Kasama sa dataset ang 257,977 oras ng pagdidikta ng doktor sa totoong mundo mula sa 31 medikal na specialty. Nire-record ang audio gamit ang iba't ibang device, kabilang ang mga telepono, digital recorder, smartphone, at speech microphone.
4. Na-de-identify ba ang data ng medikal na audio?
Oo, ang lahat ng mga audio file ay na-de-identify upang alisin ang Personally Identifiable Information (PII), na tinitiyak ang pagiging kumpidensyal ng pasyente.
5. Sumusunod ba ang dataset sa HIPAA at iba pang mga regulasyon?
Oo, ang mga dataset ay sumusunod sa HIPAA at Safe Harbor Guidelines, kasama ng iba pang pandaigdigang pamantayan sa privacy.
6. Maaari bang ipasadya ang mga dataset?
Oo, ang mga dataset ay maaaring iayon sa mga partikular na specialty, demograpiko, o mga uri ng device sa pagre-record batay sa mga kinakailangan ng proyekto.
7. Nasusukat ba ang mga dataset na ito para sa malalaking proyekto?
Talagang. Malawak ang mga dataset, na may milyun-milyong audio file, na ginagawang angkop ang mga ito para sa parehong maliit at malakihang AI/ML na proyekto.
8. Paano isinasama ang data sa mga modelo ng AI?
Ang data ng medikal na audio at mga kaukulang transcript ay ibinibigay sa mga karaniwang format na maaaring isama nang walang putol sa mga modelo ng pagkilala sa pagsasalita at natural na pagpoproseso ng wika (NLP).
9. Paano tinitiyak ang kalidad ng data?
Ang data ng audio ay sumasailalim sa mahigpit na pagsusuri sa kalidad, at ang mga eksperto sa domain ay nagpapatunay ng mga anotasyon upang matiyak ang katumpakan at pagiging maaasahan.
10. Nasusukat ba ang mga dataset para sa malalaking proyekto ng AI?
Ang gastos ay depende sa mga salik gaya ng dami ng data, pagpapasadya, at saklaw ng proyekto. Hinihiling namin na punan mo ang form na "Makipag-ugnay sa Amin" ng iyong mga kinakailangan upang matanggap ang pinakamahusay na quote.
11. Ano ang mga timeline ng paghahatid para sa mga dataset na ito?
Nag-iiba-iba ang mga timeline ng paghahatid batay sa laki at pagiging kumplikado ng proyekto, ngunit nakabalangkas upang matugunan ang mga deadline nang mahusay.
12. Paano mapapahusay ng mga dataset ng audio ng pagdidikta ng doktor ang AI?
Pinapahusay ng mga dataset na ito ang mga kakayahan ng AI sa pag-automate ng klinikal na dokumentasyon, pagpapabuti ng katumpakan ng transkripsyon, at pagpapagana ng mas mahusay na paggawa ng desisyon para sa mga provider ng pangangalagang pangkalusugan.