我需要帮助创建任务调度程序以防止线程过载

问题描述 投票:0回答:1

我想将工作人员添加到队列中,但只有前 N 个工作人员并行处理。我找到的所有示例都是 C# 语言。

这对于程序员来说可能很简单,但我不是。我对 VB 的了解足以编写简单的程序。

但是我的第一个应用程序运行良好,直到它突然达到 100% CPU 然后崩溃。请帮忙(是的,在发布此内容之前我已经浪费了 5 个小时的工作时间进行搜索...)

更多上下文:跨具有超过 100 万个目录/子目录的文件服务器执行目录结构、文件和权限的递归清单。

流程连续运行,但需要几个月才能完成。管理层已经在我脖子上喘息了。当我尝试使用任务时,它会进入大约 1000 个线程,然后达到 100% CPU,停止响应,然后崩溃。这是在具有 112 GB RAM 的 16 核服务器上。

使用提供的使用信号量的示例,这就是我放入的内容:

Public Class InvDir
    Private mSm as Semaphore
    Public Sub New(ByVal maxPrc As Integer)
        mSm = New Semaphore(maxPrc, maxPrc)
    End Sub

    Public Sub GetInventory(ByVal Path As String, ByRef Totals As Object, ByRef MyData As Object)
        mSm.WaitOne()
    
        Task.Factory.StartNew(Sub()
                Dim CurDir As New IO.DirectoryInfo(Path)
                Totals.SubDirectoryCount += CurDir.GetDirectories().Count
                Totals.FilesCount += CurDir.GetFiles().Count
                For Each CurFile As IO.FileInfo in CurDir.EnumerateFiles()
                    MyData.AddFile(CurFile.FileName, CurFile.Extension, CurFile.FullName, CurFile.Length)
                Next
                End Sub).ContinueWith(Function(x) mSm.Release())
    End Sub
End Class
vb.net multithreading task scheduled-tasks
1个回答
1
投票

您正在尝试使用磁盘 I/O 进行多线程处理。它可能会变得更慢因为你向它扔了更多的线程。无论有多少个线程,磁盘在物理上一次只能查找一个位置。 (事实上,你提到它是串行工作的。)

如果您确实想限制并发线程的数量,您可以使用

Semaphore
。信号量类似于同步锁,只不过您可以指定一次允许有多少个线程执行代码。在下面的示例中,信号量允许三个线程执行。除此之外的任何事情都必须等到完成。 MSDN 页面上的一些修改代码:

Public Class Example

    ' A semaphore that simulates a limited resource pool.
    '
    Private Shared _pool As Semaphore

    <MTAThread> _
    Public Shared Sub Main()
        ' Create a semaphore that can satisfy up to three
        ' concurrent requests. Use an initial count of zero,
        ' so that the entire semaphore count is initially
        ' owned by the main program thread.
        '
        _pool = New Semaphore(0, 3)          

    End Sub

    Private Sub SomeWorkerMethod()
        'This is the method that would be called using a Task.
        _pool.WaitOne()
        Try
            'Do whatever
        Finally
            _pool.Release()
        End Try
    End Sub
End Class

每个新线程都必须调用

_pool.WaitOne()
。这告诉它等待,直到执行的线程少于三个。每个线程都会阻塞,直到信号量允许它通过。

每个线程还必须调用

_pool.Release()
让信号量知道它可以允许下一个等待线程开始。即使有例外,这一点也很重要。如果线程不调用
Release()
那么信号量将永远阻塞它们。

如果确实需要五个月的时间,那么克隆驱动器并对同一驱动器的多个实例运行检查(每个实例查看不同的部分)怎么样?

© www.soinside.com 2019 - 2024. All rights reserved.