使用sounddevice录制扬声器的声音和录屏

news/2024/12/22 22:17:52/文章来源:https://www.cnblogs.com/tellw/p/18622662

寻找扬声器声音的可录制接口

import sounddevice as sd
import wave
import osdevices=sd.query_devices()
print(devices)for i in range(len(devices)):wf=wave.open(f'test{i}.wav','wb')wf.setnchannels(1)wf.setsampwidth(2)wf.setframerate(16000)def callback(indata,frames,time,status):wf.writeframes(bytes(indata))try:with sd.RawInputStream(samplerate=16000,blocksize=4096,dtype='int16',channels=1,device=i,callback=callback):sd.sleep(10000)print(f'{i} interface available')wf.close()except:print(f'{i} interface unavailable')wf.close()os.remove(f'test{i}.wav')

针对sounddevice.query_devices()所查询到的每个设备录制音频，出现报错则说明该设备无法录制。聆听每个可用设备所生成的test.wav，可以找到目标设备。

录制屏幕

import sounddevice as sd
import wave
import os
import time
import numpy as np
from PIL import ImageGrab,Image
import cv2
from multiprocessing import Process
import subprocess
import shutildef record_screen_motion(st):while time.time()<st:passwhile True:img=ImageGrab.grab(bbox=(0,0,1920,1080)) # windows-系统设置-屏幕-分辨率，屏幕坐标系ct=time.time()img=np.array(img.getdata(),np.uint8).reshape(img.size[1],img.size[0],3)img=cv2.cvtColor(img,cv2.COLOR_RGB2BGR)cv2.imwrite(f'{int((ct-st)*10):05d}.jpg',img)if __name__=='__main__':di=time.strftime('%Y%m%d%H%M%S')os.mkdir(di)os.chdir(di)wf=wave.open('test.wav','wb')wf.setnchannels(1)wf.setsampwidth(2)wf.setframerate(16000)def callback(indata,frames,time,status):wf.writeframes(bytes(indata))try:st=time.time()record_screen_process=Process(target=record_screen_motion,args=(st+1,))record_screen_process.daemon=Truerecord_screen_process.start()while time.time()<st+1:passwith sd.RawInputStream(samplerate=16000,blocksize=1024,dtype='int16',channels=1,device=21,callback=callback):while True:sd.sleep(10000)except KeyboardInterrupt:wf.close()files=os.listdir()existed_num=[]for file in files:if file.endswith('.jpg'):existed_num.append(int(file.split('.')[0]))existed_num.sort()count=0for i in range(existed_num[-1]):if not os.path.exists(f'{i:05d}.jpg'):shutil.copy(f'{existed_num[count]:05d}.jpg',f'{i:05d}.jpg')else:count+=1subprocess.run('ffmpeg -f image2 -framerate 10 -i "%05d.jpg" -b:v 25313k test.mp4')subprocess.run('ffmpeg -i test.mp4 -i test.wav -vcodec copy -acodec aac o.mp4') # 音频流进行aac编码，来构造视频，MP4容器中不支持PCM（pcm_alaw、pcm_s16le），https://cloud.tencent.com/developer/ask/sof/105539438print('完成录制屏幕任务')

截屏和录音在脚本启动1秒后同时开始进行，由于笔记本的垃圾性能，隔40毫秒启动一个截屏线程（以电影帧率来做帧），跟不用线程、连续截屏的效果一样（1fps），算好截屏时跟0帧之间的距离，按照10fps为帧编号，且复制补充中间帧，最后构造图片流，如果电脑硬件条件好，截屏速率大于10fps，可以考虑改变一些参数，使得画面更加流畅。

参考链接：

massorant Vosk_real-time_stt

tellw/speech_input

python 三种方式实现截屏（详解+完整代码）

创建于2412222215，修改于2412222215

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/856979.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

HarmonyOS应用开发实战-开箱即用的首页页面构建与ArkTS解析【HarmonyOS 5.0（Next）】

HarmonyOS应用开发实战-开箱即用的首页页面构建与ArkTS解析【HarmonyOS 5.0（Next）】一、HarmonyOS Next 5.0的优势 AI能力：HarmonyOS Next 5.0通过系统级AI能力，将AI下沉至操作系统并赋能给多个子系统，从而提升了应用的智能化体验。例如，小艺助手在HarmonyOS Next 5.0中…

JavaWeb案例整体分析---》差旅费报销管理信息系统-数据库操作和Mybatis配置

数据库操作 ` CREATE TABLE ter_businessapply( id VARCHAR(8) PRIMARY KEY, name VARCHAR(50) NOT NULL, position VARCHAR(50) NOT NULL, department VARCHAR(50) NOT NULL, destination VARCHAR(100) NOT NULL, departure_date varchar(30) NOT NULL, return_date varchar(3…