位置: IT常识 - 正文

扒一扒抖音是如何做线程优化的(抖音是如何成功的)

发布时间:2024-01-16
扒一扒抖音是如何做线程优化的 背景

推荐整理分享扒一扒抖音是如何做线程优化的(抖音是如何成功的),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:抖音是怎么创造的,抖音是什么样,抖音是什么样,抖音是怎样发明的,抖音是如何成功的,抖音是怎样发明的,抖音是什么样,抖音是什么样,内容如对您有帮助,希望把文章链接给更多的朋友!

最近在对一些大厂App进行研究学习,在对某音App进行研究时,发现其在线程方面做了一些优化工作,并且其解决的问题也是之前我在做线上卡顿优化时遇到的,因此对其具体实现方案做了深入分析。本文是对其相关源码的研究加上个人理解的一个小结。

问题创建线程卡顿

我们可以可以知道 start()函数底层涉及到一系列的操作,包括 栈内存空间分配、内核线程创建 等操作,这些操作在某些情况下可能出现长耗时现象,比如由于linux系统中,所有系统线程的创建在内核层是由一个专门的线程排队实现,那么是否可能由于队列较长同时内核调度出现问题而出现长耗时问题? 具体的原因因为没有在线下复现过此类问题,因此只能大胆猜测,不过在线上确实收集到一些case, 以下是线上收集到一个阻塞现场样本:

那么是不是不要直接在主线程创建其他线程,而是直接使用线程池调度任务就没有问题? 让我们看下 ThreadPoolExecutor.execute(Runnable command)的源码实现

从文档中可以知道,execute函数的执行在很多情况下会创建(JavaThread)线程,并且跟踪其内部实现后可以发现创建Java线程对象后,也会立即在当前线程执行start函数。

来看一下线上收集到的一个在主线程使用线程池调度任务依旧发生卡顿的现场。

线程数过多的问题

在ART虚拟机中,每创建一个线程都需要为其分配独立的Java栈空间,当Java层未显示设置栈空间大小时,native层会在 FixStackSize 函数会分配默认的栈空间大小.

从这个实现中,可以看出每个线程至少会占用1M的虚拟内存大小,而在32位系统上,由于每个进程可分配的用户用户空间虚拟内存大小只有3G,如果一个应用的线程数过多,而当进程虚拟内存空间不足时,创建线程的动作就可能导致OOM问题.

另一个问题是某些厂商的应用所能创建的线程数相比原生Android系统有更严格的限制,比如某些华为的机型限制了每个进程所能创建的线程数为500, 因此即使是64位机型,线程数不做控制也可能出现因为线程数过多导致的OOM问题。

优化思路线程收敛

首先在一个Android App中存在以下几种情况会使用到线程

通过 Thread类 直接创建使用线程通过 ThreadPoolExecutor 使用线程通过 ThreadTimer 使用线程通过 AsyncTask 使用线程通过 HandlerThread 使用线程

线程收敛的大致思路是, 我们会预先创建上述几个类的实现类,并在自己的实现类中做修改, 之后通过编译期的字节码修改,将App中上述使用线程的地方都替换为我们的实现类。

使用以上线程相关类一般有几种方式:

直接通过 new 原生类 创建相关实例继承原生类,之后在代码中 使用 new 指令创建自己的继承类实例

因此这里的替换包括:

修改类的继承关系,比如 将所有 继承 Thread类的地方,替换为 我们实现 的 PThread修改上述几种类直接创建实例的地方,比如将代码中存在 new ThreadPoolExecutor(…) 调用的地方替换为 我们实现的 PThreadPoolExecutor

通过字码码修改,将代码中所有使用线程的地方替换为我们的实现类后,就可以在我们的实现类做一些线程收敛的操作。

Thread类 线程收敛

在Java虚拟机中,每个Java Thread 都对应一个内核线程,并且线程的创建实际上是在调用 start()函数才开始创建的,那么我们其实可以修改start()函数的实现,将其任务调度到指定的一个线程池做执行, 示例代码如下

class ThreadProxy : Thread() { override fun start() { SuperThreadPoolExecutor.execute({ this@ThreadProxy.run() }, priority = priority) }}线程池 线程收敛

由于每个ThreadPoolExecutor实例内部都有独立的线程缓存池,不同ThreadPoolExecutor实例之间的缓存互不干扰,在一个大型App中可能存在非常多的线程池,所有的线程池加起来导致应用的最低线程数不容小视。

另外也因为线程池是独立的,线程的创建和回收也都是独立的,不能从整个App的任务角度来调度。举个例子: 比如A线程池因为空闲正在释放某个线程,同时B线程池确可能正因为可工作线程数不足正在创建线程,如果可以把所有的线程池合并成 一个统一的大线程池,就可以避免类似的场景。

核心的实现思路为:

首先将所有直接继承 ThreadPoolExecutor的类替换为 继承 ThreadPoolExecutorProxy,以及代码中所有new ThreadPoolExecutor(…)类 替换为 new ThreadPoolExecutorProxy(…)ThreadPoolExecutorProxy 持有一个 大线程池实例 BigThreadPool ,该线程池实例为应用中所有线程池共用,因此其核心线程数可以根据应用当前实际情况做调整,比如如果你的应用当前线程数平均是200,你可以将BigThreadPool 核心线程设置为150后,再观察其调度情况。在 ThreadPoolExecutorProxy 的 addWorker 函数中,将任务调度到 BigThreadPool中执行

AsyncTask 线程收敛

对于AsyncTask也可以用同样的方式实现,在execute1函数中调度到一个统一的线程池执行

public abstract class AsyncTaskProxy<Params,Progress,Result> extends AsyncTask<Params,Progress,Result>{ private static final Executor THREAD_POOL_EXECUTOR = new PThreadPoolExecutor(0,20, 3, TimeUnit.MILLISECONDS, new SynchronousQueue<>(),new DefaultThreadFactory("PThreadAsyncTask")); public static void execute(Runnable runnable){ THREAD_POOL_EXECUTOR.execute(runnable); } /** * TODO 使用插桩 将所有 execute 函数调用替换为 execute1 * @param params The parameters of the task. * @return This instance of AsyncTask. */ public AsyncTask<Params, Progress, Result> execute1(Params... params) { return executeOnExecutor(THREAD_POOL_EXECUTOR,params); }}Timer类

Timer类一般项目中使用的地方并不多,并且由于Timer一般对任务间隔准确性有比较高的要求,如果收敛到线程池执行,如果某些Timer类执行的task比较耗时,可能会影响原业务,因此暂不做收敛。

卡顿优化

针对在主线程执行线程创建可能会出现的阻塞问题,可以判断下当前线程,如果是主线程则调度到一个专门负责创建线程的线程进行工作。

private val asyncExecuteHandler by lazy { val worker = HandlerThread("asyncExecuteWorker") worker.start() return@lazy Handler(worker.looper) } fun execute(runnable: Runnable, priority: Int) { if (Looper.getMainLooper().thread == Thread.currentThread() && asyncExecute ){ //异步执行 asyncExecuteHandler.post { mExecutor.execute(runnable,priority) } }else{ mExecutor.execute(runnable, priority) } }32位系统线程栈空间优化扒一扒抖音是如何做线程优化的(抖音是如何成功的)

在问题分析中的环节中,我们已经知道 每个线程至少需要占用 1M的虚拟内存,而32位应用的虚拟内存空间又有限,如果希望在线程这里挤出一点虚拟内存空间来,其利用PLT hook需改了创建线程时的栈空间大小。

在Java层直接配置一个 负值,从而起到一样的效果

OOM了? 我还能再抢救下!

针对在创建线程时由于内存空间不足或线程数限制抛出的OOM问题,可以做一些兜底处理, 比如将任务调度到一个预先创建的线程池进行排队处理, 而这个线程池核心线程和最大线程是一致的 因此不会出现创建线程的动作,也就不会出现OOM异常了。

另外由于一个应用可能会存在非常多的线程池,每个线程池都会设置一些核心线程数,要知道默认情况下核心线程是不会被回收的,即使一直处于空闲状态,该特性是由线程池的 allowCoreThreadTimeOut控制。

该参数值可通过 allowCoreThreadTimeOut(value) 函数修改

从具体实现中可以看出,当value值和当前值不同 且 value 为true时 会触发 interruptIdleWorkers()函数, 在该函数中,会对空闲Worker 调用 interrupt来中断对应线程

因此当创建线程出现OOM时,可以尝试通过调用线程池的 allowCoreThreadTimeOut 来触发 interruptIdleWorkers 实现空闲线程的回收。 具体实现代码如下:

因此我们可以在每个线程池创建后,将这些线程池用弱引用队列保存起来,当线程start 或者某个线程池execute 出现OOM异常时,通过这种方式来实现线程回收。

线程定位

线程定位 主要是指在进行问题分析时,希望直接从线程名中定位到创建该线程的业务,关于此类优化的文章网上已经介绍的比较多了,基本实现是通过ASM 修改调用函数,将当前类的类名或类名+函数名作为兜底线程名设置。

字节码修改工具

前文讲了一些优化方式,其中涉及到一个必要的操作是进行字节码修改,这些需求可以概括为如下

替换类的继承关系,比如将 所有继承于 java.lang.Thread的类,替换为我们自己实现的 ProxyThread替换 new 指令的实例类型,比如将代码中 所有 new Thread(…) 的调用替换为 new ProxyThread(…)

针对这些通用的修改,没必要每次遇到类似需求时都 进行插件的单独开发,因此我将这种修改能力集成到 LanceX插件中,我们可以通过以下 注解方便实现上述功能。

替换 new 指令@Weaver@Group("threadOptimize")public class ThreadOptimize { @ReplaceNewInvoke(beforeType = "java.lang.Thread", afterType = "com.knightboost.lancetx.ProxyThread") public static void replaceNewThread(){ }}

这里的 beforeType表示原类型,afterType 表示替换后的类型,使用该插件在项目编译后,项目中的如下源码

会被自动替换为

替换类的继承关系@Weaver@Group("threadOptimize")public class ThreadOptimize { @ChangeClassExtends( beforeExtends = "java.lang.Thread", afterExtends = "com.knightboost.lancetx.ProxyThread" ) public void changeExtendThread(){};}

这里的beforeExtends表示 原继承父类,afterExtends表示修改后的继承父类,在项目编译后,如下源码

会被自动替换为

总结

本文主要介绍了有关线程的几个方面的优化

主线程创建线程耗时优化线程数收敛优化线程默认虚拟空间优化OOM优化

这些不同的优化手段需要根据项目的实际情况进行选择,比如主线程创建线程优化的实现方面比较简单、影响面也比较低,可以优先实施。 而线程数收敛需要涉及到字节码插桩、各种对象代理 复杂度会高一些,可以根据当前项目的实际线程数情况再考虑是否需要优化。

线程OOM问题主要出现在低端设备 或一些特定厂商的机型上,可能对于某些大厂的用户基数来说有一定的收益,如果你的App日活并没有那么大,这个优化的优先级也是较低的。

其实不管你是在做项目中,还是面试中,都会发现有一些性能优化的相关问题出现,我们一般采用的方法是发现问题→定位问题→解决问题,但有时可能有些问题的出现,第一时间想不起来解决方法或是面试时答不上来,这也就证明了你对这一块掌握的不是很熟练。为了帮助到大家快速熟练掌握性能优化的知识点,整理了《Android 性能优化》的核心笔记大家可以参考:https://qr18.cn/FVlo89

Android 性能优化核心笔记

包含内容有:启动优化、内存优化、启动优化速度、卡顿优化、布局优化、崩溃优化、应用启动全流程(源码深度解析)……等内容

本文链接地址:https://www.jiuchutong.com/zhishi/297841.html 转载请保留说明!

上一篇:web数据可视化(ECharts版)(web数据可视化(Echars版)实训)

下一篇:Vue的环境配置(vue 配置)

  • 固定资产折旧方法年数总和法
  • 餐厅打包盒算不算商品
  • 建筑公司购入的水泥等材料如果是做成本的怎么做分录
  • 个税0申报漏了2年可以补报
  • 离职人员个税申报如何处理
  • 土增税土地成本分摊方法
  • 清算期间,公司是否可以经营
  • 异地经营如何纳税
  • 会计折旧法有哪几种
  • 购进农产品取得3%专票怎样计算抵扣举例
  • 长期股权投资成本法核算
  • 出口货物是否属于存货
  • 收到费用发票入账后发现错误
  • 社保上面的每月的缴费基数是什么意思?
  • 一般纳税人税种认定有几个增值税要怎么申报呀
  • 个税中的年金是什么意思
  • 没有进货发票怎么处罚
  • 股份支付为什么计入资本公积?
  • 所有者权益的利得和损失
  • 跨年度租金收入怎么算
  • 河道工程维护费按什么标准计提
  • 税负几个点
  • 关于现代服务业的书籍
  • 所得税费用什么时候结转到本年利润
  • 流转税率是什么意思
  • 增值税发票如何红冲
  • 6月实施的新政有哪些?
  • 个人房源出租
  • 预收账款属于金融资产吗为什么
  • 淘宝无票采购账务处理
  • 核销单丢失后应该怎么挂失和补录处理呢?
  • 赔付收入及支出如何做帐务处理?
  • 折旧是属于公司成本吗
  • 苹果电脑重新安装系统磁盘锁了怎么办
  • 价款包括增值税税率吗
  • 暂估主营业务成本怎么冲销
  • php数组函数面试题
  • thinkphp微信公众号开发
  • 收到员工的罚款的会计科目
  • 处置控制的子公司有哪些
  • 金针菜的养殖方法和技术
  • 企业补缴个人所得税罚款
  • php使用memcache
  • macos big sur值得升级吗
  • 资产负债表左方烈士的资产按什么排列
  • 详解中国女足出线形势
  • PHP/HTML混写的四种方式总结
  • 累计摊销属于什么类科目
  • 公司收加盟费合法吗?
  • 深度学习的通道到底是什么?有什么用?(小白可看)
  • lstm输出多个预测值
  • php购物车及订单思路
  • 现金流量表季报本月数是三个月的数据吗
  • 科技项目经费预算取费细则
  • 工商年报股东实缴出资金额能写0吗
  • 企业支付股利属于由( )引起的财务活
  • 劳务发票去哪里开
  • 税金及附加的科目核算有哪些
  • 出库成本会计分录
  • 以前年度多计管理费用怎么调整
  • 收到社保稳岗补贴需要交税吗
  • 工程结算在资产中的作用
  • 实时缴税计入什么科目
  • 费用报销单填写标准
  • 矿山运输设备的点检绩效考核
  • 其他收入属于什么收入
  • mysql多字段数据
  • solaris 11.4
  • 电脑设置光盘启动方法
  • xp启动加速
  • win8系统找不到wifi
  • win10系统怎么关闭病毒防护
  • opengl es应用开发实践指南(android卷)pdf
  • js跨域解决方案有哪些
  • shell 正则表达式 *什么意思
  • 表单元素的基本语法
  • javascript的理解
  • shell 捕获输出结果
  • linux装python环境
  • 所得税季度预缴,年度汇算清缴
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号